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1. Bevezetés 


Már az állatvilág egyedei is (sőt bizonyos fokon a növények is) cserélnek 
információt, így növelik saját, fajtársaik és életközösségeik egyéb tagjai- 
nak fennmaradási esélyeit. Az információközlésnek a riasztástól kezdve a 
táplálékszerzésen és szaporodáson keresztül a csapat (csorda, falka, stb.) 
összetartozásának növeléséig, az összetettebb közösségek szervezéséig 
igen sokféle célja van. A közlés módozata is többféle lehet, gondoljunk 
csak a méhek bonyolult mozgására, vagy a feromonok és egyéb szagjelek 
kibocsátására, a vizuális és hangjelzésekre. Az emberek, ahogy telnek az 
évek, évszázadok, egyre összetettebb, magasabb szervezettségű közössé- 
gekben élnek, amelyek jó működéséhez egyre több információközlésre van 
szükség. Eleinte, amikor még csak a kisebb közösség éppen együtt levő 
tagjai kommunikáltak egymással, elegendő volt a mutogatás és a kezdetle- 
ges beszéd. Amikor a messzebb tartózkodó törzstagokkal és a szomszédos 
törzsekkel is meg kellett értetniük magukat, dob-, füst-, vagy egyéb fény- 
és hangjeleket használtak. Az írás kifejlődésével már nem csak térbeli, de 
időbeli távolságokat is át tudtak hidalni. Idővel elkezdték a hírközlésre 
szolgáló rendszereket gépiesíteni, így azok egyre nagyobb távolságra egyre 
több információt, tudtak továbbítani és egyre több felhasználó igényeit 
tudták kielégíteni. Jó ideje már a továbbított információ igen nagy részét 
is gépek szintetizálják, gondoljunk csak az automata gyártósorok vezér- 
lésében felhasznált adatokra, vagy akár a minden hónapban legenerált 
számlakivonatunkra. Napjainkban az információcsere egyre nagyobb há- 
nyada zajlik gépiesítve, és ahogy a dolgok állnak, ez az arány egyre nőni 
fog. És abban, hogy eddig fejlődhettek a hírközlő rendszerek, igen nagy 
szerepe volt (van) az információelméletnek. 

Az információelméletet C. E. Shannon 1948-ban írt munkájától szokták 
eredeztetni [1]. Ő maga azt írja, hogy az elmélet alapjait Nyguist [2], [3] 
és Hartley [4] tette le, több mint húsz évvel korábban, a gyökerek pedig 
egészen Boltzmannig nyúlnak vissza, aki a XIX. század végén bevezette az 
entrópia fogalmát a statisztikus fizikában. (Hogy mi köze van a rendezet- 
lenség mértékének, az entrópiának az információhoz, az rögtön a jegyzet 
első fejezetéből ki fog derülni.) Az információelmélet mára matematikailag 
alaposan kidolgozott, sokrétűen felhasznált tudományággá fejlődött, hogy 
a tudományterület egyik első magyarországi művelőjét idézzem: , A hír- 
adástechnikában ma az információelmélet hasonló szerepet tölt be, mint 
a kémiában a Mengyelejev-féle periódusos rendszer. Mint ahogy a perió- 
dusos rendszer felfedezése előtt is ismerték az elemeket és léteztek kémiai 
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módszerek, az első híradástechnikai berendezések is jóval megelőzték az 
információelméletet." Az információelmélet fejlődése nem csak lehetővé 


tette a már meglévő hírközlő eszközök rendszerezését, hanem egészen új 
módszerek, távközlési ágak kifejlődéséhez vezetett. 


A jegyzet a Széchenyi István Egyetem elsőéves villamosmérnök BSC 
hallgatóinak készült, s amellett, hogy az információ- és kódoláselmélet 
alapfogalmait leírja, igyekszik a gyakorlati felhasználásokra is utalni és a 
szükséges valószínűségszámítási és lineáris algebrai alapokat is megadni. 

A munka az elején a szükséges absztrakt információelméleti fogalmakat 
tárgyalja. Ezután könyv két fő részből tevődik össze, az első az adattö- 
mörítésről vagy forráskódolásról szól, a második a hibajavító kódokról. 
A kettő között rövid fejezet szól az információ átjuttatásáról a hírközlési 
csatornán. Végül néhány ajánlott, történelmi jelentőségű és/vagy a szerző 
által felhasznált könyv, cikk, illetve honlap címe sorakozik. 
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2. Az információelmélet alapfogalmai 


2.1. A Shannon-féle hírközlési modell 


A hírközlés során egy üzenetet el kell juttatni egy helyről (időpontból) a 
másikra valamilyen csatornán keresztül. Shannon [6] az általános hírközlési 
rendszer blokkvázlatát a következőképpen írta le: 
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A modell egyes részei a következők: 


e Az információforrás egy olyan apparátus, amely valamilyen jeleket: 
üzeneteket bocsát ki. Ezeket az jeleket kell eljuttatni a rendeltetési 
helyére. Az üzenet többféle típusú lehet: betűk, vagy szimbólumok 
sorozata (pl. az SMS vagy a távirat), egyszerű folytonos időfüggvény 
(telefon), vagy ezek csoportja (sztereó rádió), esetleg olyan függvények 
csoportja, amelyek időtől és térkoordinátáktól is függenek (IV). 


e Az adó valamilyen műveletet hajt végre az üzeneten, hogy az alkal- 
mas legyen a csatornán való átjutásra. Ez a művelet lehet viszonylag 
egyszerű, mint például a régi telefonoknál, ahol a hangot egyszerűen 
a hangnyomással arányos árammá alakították, vagy lehet összetett, 
mint a mostani telefonoknál, ahol a hangot többféle módon transzfor- 
málják, mintavételezik, és csak annyi információt hagynak meg belőle, 
amennyiből a vevő oldali berendezés szintetizálni tud egy az eredeti 
beszédet megfelelően közelítő jelet. Ezután esetleg hibajavító kódolást 


is alkalmaznak. 

e A csatorna pusztán az a közeg, amelyen átjut a jel az adótól a vevőig; 
egy réz érpár, koax kábel, üvegszál és lézerfény, egy rádiófrekvencia- 
sáv, vagy akár egy mágneses vagy optikai lemez. Az üzenet átvitele 
során a jelhez zaj adódhat, amit az ábrán a zajforrás jelképez. 


e A vevő eredetileg csak az adó által végrehajtott művelet inverzét haj- 
totta végre, hogy visszaállítsa a vett jelből az üzenetet. Ha az adó 
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több részből összetevődő operációt hajt végre az üzeneten, akkor az 
egyes részműveletek inverzét fordított sorrendben szokták a vevőben 
elvégezni. A hibajavító kódok fejlődésével a vevőre az adó műve- 
leteinek invertálásán túl egyre több és bonyolultabb feladat hárult; 
először csak hibajelzés és az üzenet megismételtetése, majd hibajavítás, 
interpoláció. 

e A rendeltetési hely az a személy vagy gép, akinek az üzenet szól. 


A jegyzet a Shannon-féle hírközlési modell kissé módosított változatát 
fogja alkalmazni: 











forrás FR kódoló fed csatorna feldekódolófe1 nyelő 
b c x y 


0 Zaj 


2.1. ábra. A hírközlési modell 









































e A félév során alapvetően diszkrét jelekből, szimbólumokból álló üze- 
netekkel fogunk foglalkozni. Feltesszük tehát, hogy a forrás által 
kibocsátott b üzenet diszkrét szimbólumok tömörített sorozata. Ha a 
továbbítandó jel folytonos lenne, azt előbb átalakítjuk diszkrét jelek- 
ké: mintavételezzük és kvantáljuk. A forrásba értjük a tömörítő vagy 
forráskódoló eljárást is. A forrás blokkvázlata: 





mintavételezés, 
fizikai forrás — kvantálás, [17 " 














forráskódolás 











e A kódolón alapvetően a hibajavító kódolást végrehajtó csatornakódo- 
lót értjük, melynek a bemenete a b tömörített üzenet, a kimenete pedig 
a c kódolt szimbólumsorozat. Erről szól a félév második fele. A csa- 
tornakódolás során ügyelni kell arra, hogy a csatorna tulajdonságait — 
zaj, veszteség - figyelembe véve az eredmény lehetőleg rövid, de nagy 
valószínűséggel érthetően visszafejthető legyen a vevőnél. 


e A csatornán olyan csatornákat értünk, amelyeknek a bemeneti és ki- 
meneti jelkészlete is véges sok elemből áll, azaz diszkrét csatornákat. 
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Igen sok, jól használható, de folytonos jelekkel működő csatorna van. 
Ezeken lehet diszkrét jeleket is továbbítani, ha a diszkrét jeleket meg- 
felelően átalakítjuk. Ez az átalakítás, vagy általánosabban a kódolt 
üzenet szimbólumainak a csatornával kompatibilissé tétele a modulá- 
tor feladata. A fizikai csatorna kimenetén természetesen egy demodu- 
látorra is szükség van, amely a csatorna jeleit visszatranszformálja a 
vevő dekódolója számára értelmezhető diszkrét jelekké. A csatorna 
blokkvázlata: 








c § , x 
1 modulátor f— I csatorna —F— I demodulátor Fe 


























Zaj 


A zaj hozzáadása az átvitt jel torzulásához, így az átvitt szimbólumok 
egymásba alakulásához vezet. 


e A dekódoló hibajavítást végez, azaz eldönti, hogy a kapott szimbó- 
lumsorozat hibás-e, és ha igen, akkor milyen szimbólumsorozatból 
keletkezhetett. Ezután -— illetve bizonyos esetekben, mint például a 
Viterbi-algoritmus, ezzel párhuzamosan - következik a csatornakódo- 
lás inverz-művelete. 


e A vevő végrehajtja a forráskódolás inverz műveletét, illetve ha az 
eredeti üzenet folytonos volt, akkor a diszkrét jelből visszaállítja azt. A 
blokkdiagramja: 
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y 4. á 3 Z ék 
—— s forráskódolá — ei vevő 

















inverze 








A forrás- és a csatornakódoló közé sok esetben egy titkosító eljárás is 
bekerül. Ez esetben a dekódoló és a forráskódoló inverze között megvan a 
titkosító eljárás visszafejtője is. 

A 2.1 ábrán látható modellnek a részeit fogjuk a következő fejezetekben 
tanulmányozni. 
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2.2. Az információ és az entrópia 


2 ze 


Matematikai kitérő - Valószínűségszámítási emlékeztető. A való- 
színűségszámítás során sokszor végrehajtható kísérletek eredményeit 
szokták eseménynek nevezni, a kísérlet fogalmát elég tágan értelmez- 
ve. A kísérlet lefolyását annyi sok tényező befolyásolja, hogy azokat 
nem tudjuk, vagy nem akarjuk figyelembe venni, hanem azt mondjuk 
róla, hogy véletlenszerű. 


Kísérlet lehet például az, hogy elküldünk egy jelet, és megfigyeljük a 
fogadott jelet, de akár vizsgálhatjuk a kettes kifutópályán adott idő 
alatt felszálló repülőgépek számát is, vagy azt, hogy leesik-e a labda, 
amit elejtünk. Ezen kísérletek kimenetelei lehetnek a következő ese- 
mények: például, hogy 800 kHz-es szinuszos jelet adva a fogadott jel 
1,6 MHz-es szinusz lesz, vagy egy 1,6 MHz-es szinusz és egy 800 kHz- 
es koszinusz jel összege; hogy reggel 8 és 10 óra között két gép szállt 
fel, vagy egy sem, mert köd volt; vagy hogy a labda leesik a földre, il- 
letve nem esik le. Szokás az eseményeket az ABC betűivel jelölni. Egy 
A esemény ellentett eseményén minden olyan esetet értünk, amikor 
A nem következik be, és A-val jelöljük. 


Nagyon sokszor elvégezve a kísérletet és megfigyelve, hogy az adott 
esemény megtörtént-e, valószínűséget lehet rendelni az eseményhez: 
egy A esemény bekövetkezésének valószínűsége 


(A) azon kísérletek száma, mikor bekövetkezett az A esemény 
p E : 





az összes kísérlet száma 


Ha például száz esetből nyolcvanszor kétszeres frekvenciájú jelet fo- 
gadtunk, 15-ször az 1, MHz frekvenciájú szinusz és egy 800 kHz-es 
koszinusz jel összegét, a többi esetben valami mást, akkor az első 
esemény valószínűsége 0,8, a másodiké 0,15, a harmadiké (hogy a 
fogadott jel sem 1, MHz-es szinusz, sem pedig az 1, MHz-es szi- 
nusz és egy 800 kHz-es koszinuszos jel összege) 0,05. Ha a menetrend 
szerint két gép száll fel a vizsgált időpontban a kettes kifutópályáról, 
elég kicsi a valószínűsége annak, hogy egy sem, vagy négy induljon, 
de még mindig sokkal nagyobb, mint annak, hogy ne essen le a lab- 
da, ha leejtjük a Földön. Ha sohasem fordulhat elő egy esemény, a 
valószínűsége nulla, ha mindig bekövetkezik, akkor pedig 1. 


Vizsgálhatunk egyszerre több eseményt is: akár ugyanannak a kísér- 
letnek az eredményét több szempontból, akár többféle párhuzamos kí- 
sérlet eredményeit. Az első esetre példa, hogy a fogadott jel szinuszos, 
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háromszög vagy egyéb, illetve 800 kHz-es frekvenciájú, 1,6 MHz-es, 
400 kHz-es, vagy másféle; az utóbbira pedig, hogy vizsgáljuk a vett 
jelet is valamilyen szempontból, és mondjuk a leadott jelet is, vagy 
akár az előző vett jelet. Definiálhatjuk két — vagy több — esemény 
összegét és szorzatát is, minkét esetben egy másik (összetett) eseményt 
kapunk: 


e Két esemény szorzatán azt értjük, ha mindkét esemény bekövet- 
kezik. Az A és B események együttes bekövetkezésének valószí- 
nűségét p( A :- B)-vel vagy p(AB)-vel jelöljük. 

e Két esemény összegén azt értjük, ha vagy az egyik vagy a másik, 


vagy mindkét esemény bekövetkezik. Az alkalmazott jelölés: 
p(47- B). 


E két mennyiség között összefüggés áll fenn: 
p(A 4 B) — p(4A) 3 p(B) — p( AB). (2.1) 


Egy esemény akkor elemi esemény, ha nem bontható fel részesemé- 
nyekre, azaz nem áll elő más események összegeként. 


A valószínűségszámítás szigorú matematikai rendszerét, az axiómáit 
Kolmogorov fektette le egy 1933-as írásában. Kolmogorov egy kísér- 
let lehetséges kimeneteit, az elemi események összességét esemény- 
térnek nevezi. Jelöljük az eseményterünket €-val. Az £? lehetséges 
részhalmazai az események. Az S halmaz legyen az összes esemény 
halmaza. Az események között lehet műveleteket definiálni: összea- 
dást és szorzást, amelyek speciálisan viselkednek. Ha O-val jelöljük a 
lehetetlen eseményt, akkor S az összeadással és szorzással akkor alkot 
c-algebrát, ha 


1. mind 2 € S, mind pedig 0 € S§, azaz a biztos esemény és a 
lehetetlen esemény is az S halmazban van, 


2. ha A; e S minden --re, akkor ) "; A; e S, azaz 5-beli események 
összegzése nem visz ki 5-ből, 


3. ha Ai € S és Az € S, akkor A1 : Az € S, azaz két 5-beli esemény 
szorzata is 5-en belüli esemény lesz. 


Minden A € § eseményhez hozzárendelünk egy 0 £ p(4) £ 1 számot, 
az esemény valószínűségét, melyre teljesülnek a következők: 
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1. p(0) — 1, 


2. ha A; : Az — 0 minden j £ i számpárosra, akkor 


(226) szenn 


Ez azt jelenti, hogy ha az események kölcsönösen kizárják egy- 
mást (de csak akkor), akkor a belőlük képezett összeg-esemény 
valószínűsége megegyezik az események valószínűségeinek az 
összegével. 


Ha információt akarunk továbbítani valamilyen csatornán, akkor igen 
fontos tudni, hogy adott bemeneti jel esetén milyen valószínűséggel 
kapjuk meg az egyes kimeneti jeleket, így szükség lesz a feltételes 
valószínűség fogalmára is. Ha A-val és B-vel két, a kísérlettel kap- 
csolatos eseményt jelölünk, és a B esemény valószínűsége nem nulla, 
akkor az A eseménynek a B feltétel melletti feltételes valószínűségén 
azt értjük, hogy milyen valószínűséggel következik be A, ha már B 
bekövetkezett, és p( Al B)-vel jelöljük: 


p(A : B) 


p(AlB) — BIB) ? 


(2.2) 
ahol p( A - B) az A és B események szorzatának, az A - B eseménynek 
a bekövetkezési valószínűsége. A feltételes és együttes bekövetkezési 
valószínűségekre igaz a következő néhány állítás: 


e Ha vizsgáljuk az egy adott B eseményt feltéve létrejöhető A1, 
A2, . . . An eseményeket, azok feltételes valószínűségeinek összege 
1 lesz, azaz 
n 
I P(41IB) — 1. (2.3) 
i—1 
e Ha vizsgáljuk az egy adott B eseményt feltéve létrejöhető A1, 
A2, . . . An eseményeket, azok B-vel együttes előfordulási valószí- 
nűségeinek összege megadja a B esemény valószínűségét, azaz 


n 


2. P(A: : B) — p(B). (2.4) 
1-1 
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e Ha az összes lehetséges A1,42, . . . An és Bi1,B2, . . . Bn események 
együttes előfordulási valószínűségeinek összegét vesszük, 1-et 
kapunk, vagyis 


EDS 


Pra — X p(Bj) —1. (2.5) 


Ha tudjuk, hogy a kísérletünk az A — (A1, 42, . . . , An) számhalmaz ele- 
meinek valamelyikét eredményezi, méghozzá sorrendben 21 , D2, . . . ,Dn 
valószínűséggel, akkor meg tudjuk mondani, mi a kísérlet eredmé- 
nyének várható értéke. Visszatérve a repülős példára: ha 0,9 való- 
színűséggel két gép száll fel az adott pályáról reggel 8 és 9 óra kö- 
zött, 0,06 valószínűséggel csak egy, és 0,02 valószínűséggel három, 
illetve nulla, akkor a felszállt repülőgépek számának várható értéke 
0,9:-2-7-0,06-1--0,02-3--0,02-0 — 1,92 lesz. A kísérlet A eredményének 
várható értéke tehát 8 

— 9 DIA. (2.6) 

i—1 


Az ettől az értéktől vett átlagos eltérést szórásnak nevezzük, és a 
következőképpen definiáljuk: 


D(A) — 4(((4— (4?) (2.7) 


Ha azt vizsgáljuk, hogy két kísérlet A és B kimenetei mennyire hason- 
lítanak egymásra, erről az A és B korrelációja adhat tájékoztatást: 


((A— (4) :(B— (B) ta 





R(A,B) — 


2.2.1. Az információ 


Shannon szerint [6] hírközlés alapvető feladata az, hogy egy valahol — az 
adónál - kiválasztott üzenetet vagy pontosan, vagy pedig valamilyen kö- 
zelítéssel reprodukáljunk egy másik helyen - a vevőnél. Az üzenetnek 
többnyire van valamilyen jelentése, amely függ a körülményektől. Egy 
mérnök számára azonban nincs igazi jelentősége ezeknek a körülmények- 
nek. Ami igazán fontos az, hogy a szóban forgó üzenet olyan, amelyet 
a lehetséges üzenetek halmazából választottak ki. A hírközlő rendszereket 
olyanra kell tervezni, hogy bármely lehetséges üzenetet továbbítani tudják. 
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Az információelmélet felépítéséhez szükség van az információ szám- 
szerű - tartalomtól, eredettől, helyzettől független — mérésére. 

Az információ, definíciója szerint valamely véges számú, előre ismert 

lehetőség közül az egyik megnevezése. 

Ahelyett a kérdés helyett azonban, hogy mekkora információt jelent az a kije- 
lentés, hogy a lehetséges m darab esemény - a forrás lehetséges m kimenete 
— közül éppen az i-edik, A;, következett be, feltehetjük úgy is a kérdést, mi 
volt a bizonytalanság arra nézve, hogy a lehetséges (41, 42, . . . , An) állapo- 
tok közül az z-edik jön létre. Az információ mértéke tehát egyenlő azzal a 
bizonytalansággal, amelyet megszüntet. 

Ha véges sok lehetséges eseményünk van, akkor annak a mérésére, 
hogy mekkora információt jelent az, hogy egy lehetséges esemény be- 
következet, tulajdonképpen bármely olyan függvény jó lenne, amely a 
lehetőségek számától monoton módon függ. Hartley azonban rámutatott, 
hogy a legideálisabb ilyen függvény a logaritmus. Ennek több oka is van: 


e Mérnöki szempontból az a legfontosabb, hogy igen sok, gyakorlati je- 
lentőségű paraméter a lehetséges kimenetek számának logaritmusával 
skálázódik. Például, ha fix számú szimbólummal dolgozunk, akkor az 
adásidő megduplázása a lehetséges üzenetek számát négyzetre emeli. 
Ez azt jelenti, hogy az üzenetek számának logaritmusa kétszereződik. 
Ha kétállapotú tárolókkal dolgozunk, akkor egy plusz tároló a lehet- 
séges állapotokat megkétszerezi, vagy az üzenetek számának (kettes 
alapú) logaritmusát növeli eggyel. 


Matematikailag jól kezelhető a kimenetek számának logaritmusa. 


Intuitív megfontolások is a logaritmus függvényt részesítik előnyben. 
Például természetesen úgy gondoljuk, hogy kétszer annyi adásidő alatt 
kétszer annyi információt tudunk közölni, vagy hogy két egyforma 
lemezen kétszer annyi információt tudunk tárolni, mint egyen. Ezek 
a megfontolások mind afelé mutatnak, hogy az állapotok számának 
logaritmusa igen jó információmérő függvény. 


Nézzünk egy klasszikus példát. Ha a lehetséges kimeneteket tartalmazó m 
elemű halmaz elemeit azonosítani szeretnénk — például barkochbázunk úgy, 
hogy csak előre megadott m dologra gondolhatunk (mondjuk a számokra 1- 
től m-ig) —, és 2" c m c 2"t1, akkor legfeljebb k-- 1 kérdés után megtudjuk, 
mire gondolt a másik, azaz azonosítani tudjuk az elemet. 
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Hartley az információt az 
I -— logym (2.9) 
mennyiséggel azonosította. 

A logaritmus alapja azért kettő, mert két lehetséges válasz van a kérdé- 
sekre: igen és nem. A számítástechnikában használt bináris számrendszer 
és a leggyakrabban használt kétállapotú tárolók miatt is előnyös a logarit- 
mus alapjának a kettőt választani. Ez a definíció azonban csak igen speciális 
esetekre alkalmazható, csak akkor, ha minden lehetséges kimenet valószí- 
nűsége azonos, 1/m. Ha a lehetséges események előfordulása nem egyenlő 
valószínűségű, azaz az események valamilyen statisztikát követnek, akkor 
kicsit módosítani kell a definíciónkon. 

Minél váratlanabb egy eredmény annál nagyobb információtartalmat 
rendelnek bekövetkezéséhez. 

Legyen a lehetséges események halmaza A — (41, 42, . . . Am), az Ai ese- 
mény valószínűsége pi, az A2-é D2,. . . , az Am-é pedig pm. (A valószínűsé- 
gekre igaz, hogy 2721 pi; — 1.) Ha az i-edik esemény következett be, annak 
az információtartalma 


1 
I(A;) — I(p:) — log? 7 — — log. D;.. (2.10) 


Ezt a definíciót C. E. Snannon fogalmazta meg először 1948-as cikkében [1]. 

Az információ mértékegysége ez esetben a bit (a binary digit szavak 
Tukey által javasolt összevonásából). Természetesen más alapú logarit- 
mussal is lehet definiálni az információt, csak akkor az egysége más lesz, 
természetes alapú logaritmus esetén például az egység a nat, tízes alapú 
logaritmussal hartley. 


2.1. Példa: Hány bit lehet egy nat? Hány hartley egy bit? 


1 nat információt akkor nyerünk, ha a bekövetkezett esemény p valószínűségére 
igaz, hogy 


1 
—1lnp—1l]ln-—-—1, 
p 
azaz p — 1/e. Ennek az eseménynek az információtartalma bit egységekben: 
1 
— log; — — log; e z 14427. 
e 


A 1 bit információtartalmú esemény előfordulási valószínűsége 1/2. Ennek a 
hartleyben kifejezett információtartalma 


1 
-1]g2 — lg2 5 0,301. 
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Ha az események mindegyike p; — -- valószínűségű, visszakapjuk az 
információ Hartley-féle definícióját: 





1 1 
IÍ(p- — — log; — — log, m. 
m m 


2.2. Példa: Statisztikai elemzések alapján az angol nyelvű szövegekben az 
E betű fordul elő leggyakrabban, px — 0,1073 valószínűséggel, a következő 
leggyakoribb betű a T, melyre pr — 0,08356, a legritkább pedig a O, po — 
0,00063 előfordulási valószínűséggel. Adjuk meg e három betű vétele során 
nyert információt külön-külön az egyes betűkre és a , IEFO" sorozatra, ha 
feltesszük azt, hogy az egyes helyeken a betűk bekövetkezése egymástól 
független esemény. 


A feladat első részéhez egyszerűen behelyettesítjük a valószínűségeket a (2.10) 
képletbe: 


I(E) — —log pe — —loga 0,1073 sz 322 
I(T) — —logapr — —1og; 0,0856 z 3,55 
I(a) -— —log:pa — —log; 0,00063 z 10,63 


Az, hogy a szövegben az egyes pozíciókban betűk előfordulása független 
esemény, elég erős közelítés, hiszen például a , 0" betű után szinte mindig , U" 
következik az angol szavakban, a , IT" után meg gyakran jön , H7. Ha azonban 
független eseményeknek tekintjük a betűk egymásutánját, akkor a , TEO" sorozat 
előfordulási valószínűsége az egyes karakterek előfordulási valószínűségeinek 
szorzata, azaz PTEo — DT : DE : Do. Így a sztring információtartalma: 


I(TEG) — — log; prea — — log; pr —log2 pe —log2 pa A 3,22-4-3,55--10,63 — 174. 


Az információ tulajdonságai: 
1. Csak az esemény valószínűségének függvénye. 
2. Nem negatív: azaz I 2 0. 


3. Additív: ha az események száma m — mi : m2 alakban két termé- 
szetes szám szorzataként áll elő, azaz az események csoportosíthatók 
mi darab m2 elemű csoportra, akkor az információk összeadódnak: 


I(ma : ma) — I(mi) - I(m2). (2.11) 


Tartalom ] Tárgymutató Ses alt 


Információelmélet Az információ és az entrópia 
Tartalom ] Tárgymutató E 3 4a185b 





Ez azt jelenti, hogy ugyanakkora információra van szükség egy elem 
azonosítására, hogy ha az egész halmazban keressük, mint ha előbb 
azonosítanánk az m2 elemű részhalmazt, amelyben van, majd a rész- 
halmazon belül keresnénk meg az elemet. 


4. Monoton: a logaritmus függvény monoton növekvő, így a 10g2(1/p) — 
— log p monoton csökkenő. Ez azt jelenti, hogy ha p; C pj, akkor 
I(A;) 5 I(A;). Minél nagyobb valószínűségű tehát egy (A;) esemény 
bekövetkezése, annál kisebb információval szolgál, és minél valószí- 
nűtlenebb az ( A;) esemény annál nagyobb az információtartalma, ha 
mégis előfordul. 


5. Normálás: ez lényegében az információ egységének kiválasztása. Le- 
gyen I(A;) — 1, ha p; — 1/2, így a bit egységet kell használni. 


2.2.2. Az entrópia 


Ha m darab, egymást kizáró eseményt veszünk, feltehetjük azt a kérdést, 
milyen átlagos információtartalommal bír az, hogy tudjuk, az egyik bekövet- 
kezett. A válasz az információ várható értéke: ) "2 1 p:.I(p:). Ezt az átlagos 
információt nevezték el entrópiának. 


Shannon információdefinícióját felhasználva az entrópia a 


H(P1D2;  . . Dm) — — ) pi log2 Di (2.12) 
í—1 
alakot ölti. 
(A p: log; p; kifejezés p; — 0 esetben a LHospital-szabály szerint nullát ad.) 


2.3. Példa: Tegyük fel, hogy a forrásunk öt szimbólumot bocsáthat ki, a1-et, 
a2-t, a3-at, a4-et és a5-öt, mindegyiket egyforma valószínűséggel. Mekkora 
az egy szimbólum kibocsátásával átadott átlagos információ, azaz mekkora 
a forrás, mint halmaz entrópiája? 


Egy-egy szimbólum kibocsátásának valószínűsége 0.2, így a keresett entrópia: 


H(a1,a2,a3,a4,a5) ——D1 log2 p1—D2 log2 p2—ps3 log2 p3—pa log2 pa—ps log2 ps — 
—-—5 : 0,21og; 0,2 A 2,32 


2.4. Példa: Tegyük fel, hogy a forrásunk továbbra is öt szimbólumot bocsát- 
hat ki, a1-et, a2-t, a3-at, a4-et és a5-öt, azonban más és más valószínűséggel. 
Legyen pa, — 0,35, Da — 0,20, pa; — 0,10, pa, — 0,20 és pa, — 0,15. Mekko- 
ra az egy szimbólum kibocsátásával átadott átlagos információ? 
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Az entrópia (2.12) definíciójába behelyettesítve a valószínűségeket: 


H(a1,a2,a3,a4,a5) ——pi l0g2 pi —p2 log2 p2 —p3 log2 ps —pa log2 pa —ps l0g2 ps — 
— —0,35 log; 0,35 — 0,21og; 0,2 — 0,11og; 0,1 — 0,21og; 0,2 — 
—0,15 log; 0,15 A 2,20 


2.5. Példa: A forrásunk továbbra is öt szimbólumot bocsásson ki, Da, — 
0,60, paz — 0,12, paz — 0,08, pa, — 0,05 és pa. — 0,15 valószínűségekkel. 
Mekkora az egy szimbólum kibocsátásával átadott átlagos információ? 


Az entrópia (2.12) definíciójába behelyettesítve a valószínűségeket: 


H(a1,a2 a3,a4,a5) ——p1 log2 p1—p2 log2 p2—p3 log2 pz3—pa4 log? pa—Dp5 log2 ps — 
— —0,6 log; 0,6 — 0,121og, 0,12 — 0,08 log; 0,08 — 
—00510g2 0,05 — 0,1510g2 0,15 5 1,73 


Figyeljük meg, hogy minél közelebb van a rendszer az egyenletes 
valószínűség-eloszláshoz, annál nagyobb az entrópiája. Hasonlóképpen 
statisztikus fizikában minél közelebb volt a rendszer a teljesen rendezet- 
len állapothoz annál nagyobb volt az entrópiája, avagy a rendezetlensé- 
gének a mértéke. A teljesen rendezetlen állapot az, amelyben semmiféle 
strukturáltság nem figyelhető meg, ahol a részecskék (állapot térbeli 
eloszlása egyenletes. 


Az entrópia a következő tulajdonságokkal rendelkezik: 


1. Nem negatív, azaz H(pi1.p2, . . . Dm) 2 0. 


2. Folytonos függvénye a valószínűségeknek, azaz ha a (p1,p2, . . . Dm)-ek 
közül az egyik p; valószínűséget kicsit megváltoztatjuk (a többit is 
úgy, hogy az összeg 1 maradjon), akkor az entrópia is csak kicsit fog 
megváltozni. 


3. Hap —lésp;— 0,azi—1,...,k—1,k 7 Ll, . . . m indexű esemé- 
nyekre, akkor H(pi1,p2, : . . Dm) — 0, azaz egy biztosan bekövetkező és 
bármennyi lehetetlen eseményből álló halmaz nem hordoz informáci- 
ót. 

4. H(pi.D2, . . . Dm.0) — H(piD2, . . . Pm), azaz egy lehetetlen esemény 
hozzáadása az eseményhalmazhoz nem befolyásolja az entrópiát. 
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5. H(Di.D2,...Pm) £ H(I/m.1/m,...,1/m) — log; m, azaz a legna- 
gyobb várható információtartalma egy eseménynek akkor van, ha 
minden esemény azonos valószínűséggel következik be. Speciálisan, 
ha egy eseményből és az ellentett eseményéből álló halmazunk van, 
akkor az entrópia a 


H(A,4A) — H(pA — p) — —plog2p — (1 — p) log2(1 — p) 
függvény szerint változik, amelyet az alábbi ábrán láthatunk. 


H(pl — p) ! 








fv 0.5 1 


Dp 
Leolvasható, hogy a függvény maximuma a p — (1 — p) — 1/2-nél van. 


6. H(DPi1,D2, . . . Dm) szimmetrikus a változói felcserélésére: 


H(D1, : . . Dk—1.D£:.Dk-L; : : - 0—1.Pk:D47-1; - - : Pm) E 
sz H(pi.D2, ts b Dm); 


bármely k 7 ( párosra. 


2.2.3. A kölcsönös és a feltételes entrópia és tulajdonságaik 


Tegyük fel, hogy két eseményhalmazunk van, az A — (A1, 42, . . . , Ami) és 
a B — (B1,B2, . . . Bm. b, és ez a két halmaz valamilyen módon kapcsolódik 
egymáshoz. Például az A halmaz a forrás szimbólumkészlete vagy a leadott 
jeleké, a B pedig a lehetséges vett jelek halmaza. Ezenkívül minden A- 
beli esemény bekövetkezése maga után von egy B-beli eseményt (vagy 
fordítva). Az A halmaz i-edik és a B halmaz j-edik elemének együttes 
bekövetkezési valószínűsége 


Di j I p( A; új B;). (2.13) 


Ha a két esemény független - tehát ha az, hogy milyen B5-t kapok nem függ 
attól, hogy milyen volt az A; —, akkor a p( A; : B; ) — p( A;) : P( B; ), egyébként 
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az együttes valószínűség mindig kisebb, mint az egyedi valószínűségek 
szorzata, azaz p( A; : Bj;) C p(A;) : p(B;). 
Az A; és B; események együttes bekövetkezésekor nyert információ 


I(A; : Bj) — —log2 p(A: : B; ), (2.14) 


amely — mivel az együttes valószínűség sosem nagyobb, mint bármely 
esemény előfordulásának valószínűsége — sosem kisebb, mint az egyes 
eseményekhez rendelhető információ, azaz 


I(A;:B) 3 I(A) és  I(A.:Bj)3 K(B;). (2.15) 


Egyenlőség csak akkor áll fenn, ha a másik esemény (az első egyenlőtlenség 
esetében B;, a másodikéban A;) biztosan bekövetkezik. 
Az A és B eseményhalmazok együttes, vagy kölcsönös entrópiája a 


mi m2 


H(A-B)—— 3 2 Di 1l082Dij (2.16) 


i—1 j—1 
mennyiség. Ha A és B elemei egymástól függetlenek, akkor (de csak akkor) 
igaz, hogy a kölcsönös entrópiájuk egyenlő az entrópiáik összegével. 

Ha az A eseményhalmaz egy-egy elemének bekövetkezése maga után 
vonja valamely B-beli elem bekövetkezését, például az A elemei a forrás 
szimbólumkészlete, a B pedig a lehetséges vett jelek halmaza, akkor érde- 
mes feltenni a kérdést, hogy ha csak B elemeit tudjuk megfigyelni, és B;5-t 
észleltük, akkor mekkora átlagos bizonytalanság maradt azzal kapcsolat- 
ban, hogy melyik A-beli elem váltotta ki azt. Ez az átlagos bizonytalanság, 
illetve az ezt megszüntető átlagos információmennyiség az A halmaznak a 
B-re vonatkoztatott feltételes entrópiája: 


H(AIB) — — 3 p(B;) x P(4A:IB;) log? p( A:1B;) — 
j—I1 i—1 


mi m2 


- -FYP(A: Bj) log p(AiIB,). (2.17) 


1-1 j—1 


Ha felhasználjuk azt, hogy p( A; : B;) — p( B; )p( A] B; ) akkor levezethetjük 
a kölcsönös és a feltételes entrópia közötti összefüggést: 


H(A- B) — H(B) 4 H(AIB) — H(A) 4 H(BIA). (2.18) 


Szemléletesen ez azt jelenti, hogy a két esemény együttes megfigyelésével 
nyert átlagos információ egyenlő az egyik esemény megfigyelése során 


Tartalom ] Tárgymutató S sz alle 


Információelmélet Az információ és az entrópia 
Tartalom ] Tárgymutató e s áazb 





kapott információnak és az egyik esemény megfigyelése után a másikra 
maradt átlagos bizonytalanságot megszüntetni képes információ mennyi- 
ségének összegével. 

Logikus, hogy egy esemény közvetlen megfigyelésével nem nyerhetünk 
átlagosan kevesebb információt, mint akkor, ha egy másik eseményt előtte 
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már megfigyeltünk, és csak aztán figyeljük meg az előzőt, azaz 


H(A) 2 H(AIB) 20. (2.19) 
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3. Forráskódolás 


Forráskódoláson a hírközléselméletben azt értjük, hogy a már diszkrét 
jelekké átalakított üzenetet egy másik, szintén véges elemszámú szimbó- 
lumkészlettel lehetőleg igen tömören reprezentáljuk. Az eredeti üzenet 
kvantálásával, azaz diszkrét jelekké való átalakításával egyelőre nem foglal- 
kozunk. Adott tehát egy véges elemszámú halmazunk, A, az úgynevezett 
kódábécé elemeiből álló sorozatokra (kódszavakra) úgy, hogy bármilyen 
üzenetet dekódolni lehessen, és minél rövidebb kódszavakat kapjunk. 


3.1. Diszkrét információforrások 


Az üzenetet létrehozó apparátus a forrás, a mi esetünkben az üzenet véges 
sok elemből felépülő sorozat. 

Ha a forrás által kibocsátott üzenet egy olyan diszkrét jelekből álló so- 
rozat, amelynek minden szimbóluma egy véges elemszámú halmaz -— a 
forrásábécé - eleme, akkor diszkrét információforrásról beszélünk. 

A forrás felfogható egy olyan gépezetnek, amely betűről betűre generál- 
ja az üzenetet, és a soron következő szimbólumot úgy választja ki, hogy 
figyelembe veszi a forrásábécé egyes elemeihez rendelt előfordulási valószí- 
nűségeket és esetleg a korábbi választásait. Azokat a rendszereket, amelyek 
egy valószínűséghalmaz felhasználásával hoznak létre diszkrét sorozato- 
kat, sztochasztikus rendszereknek nevezzük. A sztochasztikus folyamatok 
matematikájából csak igen kis szeletet fogunk itt megismerni. 

Ha a forrásunk az A — (41,42, . . . , An) szimbólumhalmazzal, mint 
forrásábécével működik és csak az egyes szimbólumok előfordulási va- 
lószínűségét, azaz csak a P — Ípi,p2, . . . Pn) halmazt használja fel az 
üzenet létrehozásakor, akkor emlékezet nélküli forrásról beszélünk. TIe- 
kintsük a forrás egymást követő N szimbólum-kibocsátását, mint esemé- 
nyeket. Emlékezet nélküli forrás esetén ezek az események függetlenek 
egymástól. A forrás ezen kívül stacionárius is, ha minden alkalommal az 


A — (41, 42, . . . , An) halmaz elemei közül bocsát ki jelet, méghozzá min- 
dig pi1,D2, . . . Dn valószínűséggel, azaz sem a kódábécé, sem pedig annak 


eloszlása nem változik az időben. 

Előfordulhat azonban, hogy az, hogy milyen szimbólum volt a forrás 
kimenetén az előző néhány lépésben, befolyásolja az aktuális választást. Ha 
egy emberi - például magyar - szöveg az üzenet, akkor nyilvánvalóan más 
lesz az egyes szimbólumok előfordulási valószínűsége attól függően, hogy 


a korábbi betű mi volt. Például egy P után sokkal nagyobb valószínűséggel 
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következik E, mint egy Ü után, azaz p(EIP) 5 p(EIÜÚ). Egy olyan stacio- 
nárius forrás, amelynél egy szimbólum kibocsátására mindig csak az azt 
megelőző egyetlen szimbólum van hatással, jól leírható a p( Aaxtuális I Aelőző ) 
feltételes valószínűségekkel, vagy egy olyan gráffal, amelynek a csomó- 
pontjai a lehetséges előző szimbólumokat jelzik, az élei pedig az új szim- 
bólumokat. Egy-egy él mindig abba a csomópontba mutat, amelyik új 
szimbólumot jelképezi, hiszen a következő lépésben az lesz a régi szim- 
bólum. Az Adózó-ből az Aaktuális Pontba mutató élhez a p( Aaktuális I Aelőző ) 
valószínűséget rendeljük. 


3.1. Példa: Vizsgáljunk meg egy egyszerű, háromelemű ábécét használó 
forrást. Legyen a betűinek előfordulási valószínűsége pa — 5/16, pg — 
13/32, és pc — 9/32, az egyes szimbólumok feltételes valószínűségeit pedig 
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tartalmazza a következő táblázat: 





p(ailaj) A 5 C 
A 3/10 5/1383 2/9 

0 B 7710 0 243 
c 0 8/13 1/9 














Adjuk meg a forráshoz tartozó gráfot, és számoljuk ki az egyes betűkombi- 
nációk előfordulási valószínűségét. 

A gráf csomópontjai az egyes szimbólumok, az , A", , B" és , C" betűk. Az ACA 
élhez tartozó valószínűség a p(A]JA) — 3/10, az A—B élhez tartozó valószínűség a 
p(B]A) — 7/10, és így tovább, amint az ábra mutatja: 
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Az , AB" betűpáros együttes előfordulási valószínűsége felhasználva a (2.2) 
definíciót 


T 5 7 
AB) — p(B1A) - p( A) — — - — — — 
P(AB) — p(BIA) .p(4)— 316735 
a , BA" betűpáros együttes előfordulási valószínűsége 
5 13 5 
P(BA) — p(AIB) -p(B)— 55333 
a , AA" betűpárosé pedig 
3 5 3 
(AA) — p(Al4) -p(4)— ge 


Hasonlóképpen a többi együttes valószínűség is kiszámítható, az eredményeket a 
következő táblázat tartalmazza: 





Plasa) A B c 
A 13/82 7/32 0 

i B ]5/32 0  1/4 
C [11/16 3/16 1/32 

















Látható, hogy a sorok, illetve az oszlopok összege kiadja az aktuális elemek 
előfordulási valószínűségét, mint azt a (2.4) egyenlőség is leírja, azaz 


2. p(aiaj) 7 2, p(ajai) — p(aj). 


Mivel az egyes betűk előfordulási valószínűségeinek összege 1 (azaz ) , ; p(aj) — 1), 
a táblázat összes elemét összeadva 1-et kapunk, ahogy a (2.5) is állítja. Figyeljük 
meg azt is, hogy a p(a;]laj ) táblázat oszlopaiban felsorolt valószínűségek összege 


1, azaz 
9 P(azla;) - 1. 


Ez a (2.3) állítást hivatott demonstrálni. 


Ha egy folyamat során adott a rendszer lehetséges állapotainak egy 
S — (5152, . . . , n) halmaza, valamint az S; és S; állapotok közötti p( 551 S; ) 
átmeneti valószínűségek, és a következő állapotba kerülést csak ezek az 
átmeneti valószínűségek befolyásolják, akkor egy Markov-folyamatról 


van szó. A Markov-folyamatokra vagy Markov-láncokra igaz, hogy 


P(Sújl Selőző Selőző—1 - : - Selőző—m) — P(Sújl Selőző) 


bármely m-re, azaz csak a legutolsó állapot van hatással arra, hogy mi lesz a 


következő állapot. A Markov-folyamatokat a 3.1 példában látott gráfokkal 
szokták szemléltetni. 
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A forrásokat általában Markov-folyamatokkal lehet leírni. 

Markov-folyamat volt az az eset is, amikor az egymást követő 
szimbólum-kibocsátások egymástól független események voltak: akkor 
egyetlen lehetséges § állapot volt és az egyes karaktereknek megfelelő élek 
abból indultak ki és oda is érkeztek, a hozzájuk rendelt valószínűség pedig 
a p( A;) előfordulási valószínűség. 

A 3.1 példában az állapotok megegyeznek az aktuálist megelőző ka- 
rakterrel, azaz S1 —, A", S2 —, B" és Sz —, C"; az átmeneti valószínűségek 
pedig a p(a:laj ) feltételes valószínűségek. 

Az olyan források, amelyeknél egy szimbólum kibocsátása az azt mege- 
lőző m szimbólumtól függ, szintén modellezhetők Markov-folyamattal, 
csak ekkor az állapotok a soron következő szimbólum előtti m hosszú 
szimbólumsorozatok, azaz S; — Adőző; Aelőző;—1 : : : Aelőző;—m. AZ átmeneti 
valószínűségek is p( Aaktuális I Aelőző Aelőző—1 : : . Aelőzó—m) típusúak lesznek. 


Pontosabb modell lehet egy forrásra, ha nem karaktereket, hanem sza- 
vakat veszünk az egységeinek, csak sokkal több lehetséges kibocsátott 
szó van, mint betű, így sokkal bonyolultabb modellt kapunk. Ez az eset 
is leírható Markov-folyamattal. 


3.1.1. Forrásentrópia 


Tegyük fel, hogy a forrásunk egy adott S; állapotban van. Ha ismertek a 
p(S;1lS;) átmeneti valószínűségek minden j-re, akkor ki tudjuk számolni az 
i-edik állapotra a H(SIS;) feltételes entrópiát. A forrásentrópia ezeknek a 
H(SIS;) feltételes entrópiáknak a várható értéke, azaz ha P; az S; állapot 
előfordulási valószínűsége, akkor a forrásentrópia: 


H — 2 gé SIS;) md p(S;1S;) loga p(S;15S;) (3.1) 


ij 


Nyilván P-t, az S; állapot előfordulási valószínűségét — bizonyos speciális 
eseteket kivéve — csak a forrás hosszú idejű megfigyelésével lehet megálla- 
pítani. 

Ha a forrás stacionárius (és természetesen emlékezet nélküli), akkor az 
S; állapotok maguk az i-edik szimbólumok lesznek, a P; valószínűség pedig 
nyilván meg fog egyezni az A; szimbólum előfordulási valószínűségével, p;- 
vel. Stacionárius forrás esetén az egyes szimbólum-kibocsátások egymástól 
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független események, így 
2(Sjl5.) — p(AjlA;) — p( Aj) — Dj. 
A forrásentrópia tehát 


— ) pi" 2 pjlog2pj — — X  pj log pi 
i j j 


meg fog egyezni az egyetlen szimbólum kibocsátásának entrópiájával. 
. Egy alternatív megközelítés: A forrásentrópia a forrás által kibocsátott 
N darab egymás utáni szimbólum együttes entrópiájának N-ed része, 
ha az N — co határértéket vesszük, feltéve, hogy létezik ez a határérték. 
Stacionárius forrásoknál mindig létezik a határérték. 


3.2. Egyértelműen dekódolható kódok 


Legyen a forrásábécénk az A — (41,42, . . . , An) halmaz, a kódábécénk 
pedig a B — (B1,B2, . . . Bs ) halmaz. Az üzenetek az A elemeiből képezett 
véges sorozatok. Az üzenetek halmazát A-val jelöljük. A B elemeiből álló, 
véges hosszúságú sorozatokból, azaz a kódszavakból álló halmaz pedig a 
B. Kódnak nevezünk ekkor minden f : AR B függvényt, azaz az olyan 
leképezéseket, amelyek a forrásábécé elemeit kódszavakba transzformálják. 

Egy f : Az£ B kód egyértelműen dekódolható, avagy megfejthető, ha 
segítségével minden B elemeiből álló véges sorozat csak egyféle A-beli 
üzenetből állítható elő. (Ez több, mint ha csak azt követelnénk meg, hogy 
invertálható legyen a leképezés, lényegében azt követeljük meg, hogy az 
f-ekből felépített F : A — B leképezés legyen invertálható.) 

Egy f : AR B kódot prefixnek nevezünk, ha a lehetséges kódszavak 
közül egyik sem a másik folytatása. Ugyanazt jelenti, ha azt követeljük meg, 
hogy egyik kódszó végének megcsonkításával se kapjunk másik értelmes 
kódszót, bármekkora is legyen a levágott rész. Ha egy kód prefix, akkor 
egyben egyértelműen dekódolható is. 

Például, ha A — fa,b,ct a forrásábécénk, akkor prefix kód lehet, ha a 
három karakterhez a 0), az 10 és az 110 kódszavakat rendeljük, nem prefix, 
de megfejthető, azaz egyértelműen dekódolható viszont az, ha a 0, a 01 és 
a 011 lesznek az érvényes kódszavak. (Ez utóbbi kód posztfix: azaz, ha 
bármely kódszó elejéről vágunk le bármekkora darabot, nem kaphatunk 
másik értelmes kódszót.) 
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3.3. A kódszavak átlagos hossza és a róluk szóló tételek 


Természetesen, ha megállapodtunk, hogy minden kódszó egyforma hosszú, 
de különböző, akkor a kód egyértelműen dekódolható, sőt prefix lesz. A 
forráskódolás fő célja viszont a minél rövidebb kódolt üzenet létrehozása, amelyet 
az állandó kódszóhossz nem segít elő. Ha azonban a forrásábécé nagyobb 
valószínűséggel előforduló elemeihez rövidebb kódszavakat, a valószínűt- 
lenebbekhez meg hosszabb kódszavakat rendelünk, akkor már tettünk 
egy nem elhanyagolható lépést az entrópianövelés (tömörítés) felé. Az 
olyan kódokat, amelyek a forrásábécé betűihez eltérő hosszúságú kód- 
szavakat rendelnek, változó szóhosszúságú kódoknak nevezzük. Az A; 
forrásábécébeli elemhez rendelt kódszó hosszát (;-vel jelöljük. 

Egy f: AR B kód L(4) átlagos szóhosszán ezen (;-k (2.6) szerinti 
várható értékét értjük, azaz 


I(A) — 2 Dili, (3.2) 
iz 


ahol p; a forrásábécé A; elemének előfordulási valószínűsége. 

A McMillan-féle egyenlőtlenség kapcsolatot teremt a kódábécé ele- 
meinek s száma és a forrásábécé A; betűihez rendelt kódszavak (; hossza 
között a következőképpen: Minden egyértelműen dekódolható f : Am B 
kódra igaz, hogy 


B. El (3.3) 
1-1 


A Kraft-egyenlőtlenség lényegében a McMillan-egyenlőtlenség állítá- 
sának megfordítása. Legyenek (1), (2, . e. ., (n természetes számok, s 5 1 
egész. Ha ezekre igaz, hogy 


n 


Y.s6 c1, (3.4) 


1-1 


akkor létezik olyan prefix kód, amely s elemű kódábécével rendelkezik 
és egy n elemű forrásábécé i-edik eleméhez éppen (; hosszúságú kódszót 
rendel hozzá. 

Az egyértelműen dekódolható kódok átlagos kódszóhosszáról szóló tétel a forrás 
szimbólumainak entrópiájától és a kódábécé elemeinek számától függő 
alsó korlátot ad meg a kódszavak átlagos hosszához. A következőt állítja: 
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Minden egyértelműen dekódolható f : AR B kódra 


as 


(A 
10g2 5 





L(4A) 2 8.5) 


Bizonyítás: Először átszorzunk a jobb oldal nevezőjével és felhasználjuk 
az átlagos kódszóhossz (3.2) definícióját: 


H(A) c 2 Dili : loga s — — D Di log st. (8.6) 
í—1 í—1 


Ezt az egyenlőtlenséget szeretnénk bebizonyítani. Bevezetjük a g; — 
s7t/ (227 575) segédmennyiséget. Ezenkívül felhasználjuk azt, hogy 
minden p; 2 0, ag; 5 0 i — 1,2, . . . n számokra, ha 2)", p:— lés)" ;g — l, 
akkor n n 
— 2 pilog2 pi £ — d pi log? 9: (3.7) 
i—1 i—1 
Definíció szerint n 
H(A) — — bi pi log5 pi. (3.8) 
i—1 
A (8.7) egyenlőtlenség bal oldala tehát az entrópia, a jobb oldalába pedig 
beírhatjuk a g; mennyiségeket, így 
s7ti 


H(A) c —N pilogy — —— — 
( ) — 2.p 082 N5-I1 s-t 


— pa pilog2 s " - log; p3 4) : pa Di. (8.9) 
í—1 j—1 í—1 


A második tagban a p;-k összege 1. Ha felhasználjuk a (3.3) McMillan- 
egyenlőtlenséget, meg azt, hogy a logaritmus függvények monoton nö- 
vekvők, kiderül, hogy a második tag nullánál kisebb, így az egész összeg 
felülről becsülhető az első tagjával. Ezzel beláttuk a tételt, igazoltuk, hogy 
(3.6) teljesül. (O.E.D) 

A prefix kódok között van olyan, amelyik a kódszóhossznak ezt az alsó 
korlátját elég jól megközelíti. Erről szól a következő tétel: 
Létezik olyan f : A— B prefix kód, amelynek az átlagos kódszóhossza 


H(A) 


I(A 
( 1. 





ESB (3.10) 
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Tartalom ] Tárgymutató SE SG 4305 
Bizonyítás: Legyenek (£1 (2, . . . (n pozitív egész számok, amelyek mind- 
egyikére igaz, hogy 
1 ; 1 ; 
sz SSE zzz SEB elf, (3.11) 
log2 s 10g2 s 


Így a p:-kből egyértelműen következnek az (;-k. Figyeljük meg, hogy 
a log; p;/ log; s kifejezés tulajdonképpen p;-nek az s alapú logaritmusa, 
log; Di. 

Vizsgáljuk először a bal oldali egyenlőtlenségeket, pontosabban azoknak 
a —1-szeresét minden 7-re: log, p; 2 —(;. Emeljük őket az s kitevőjébe, majd 
adjuk össze minden i-re: 


n 


n n 
baj s c ba s1985 Pi — DD — 1. (3.12) 
i—1 í—1 


1-1 


Így azt kaptuk, hogy az (; számok kielégítik a (3.4) Kraft-egyenlőtlenség 
feltételeit. Így az 4; számok lehetnek egy s elemű kódábécével rendelkező 
prefix kód n darab kódszavának a hosszai. 

Ha megszorozzuk a jobb oldali egyenlőtlenséget minden --re p;-vel, majd 
összegezzük őket, akkor a 


DDili 2 7269 Jog2 Pi KEN (3.13) 
is] is 


" logo 5 





kifejezésre jutunk, amelynek a bal oldala a kódszavak hosszának várható 
értéke, L(A), a jobb oldal pedig pont H(A)/(log; 5) -- 1. (2.E.D.) 


Ez utóbbi két tételt együttesen nevezik Shannon első, avagy forráskó- 
dolási tételének. Eszerint: 


Egy emlékezet nélküli és stacionárius forrás 4A1,A?2, . . . , An szimbólumaihoz 
lehet találni olyan s elemű kódábécével rendelkező (41 ,(2, . . . /n hosszúságú 


kódszavakat rendelő f : AR B kódot, melynek átlagos L(4A) szóhossza 


H(A) 
logo s 








STT Ae zők (3.14) 


logo s 


Bináris kódok esetén, azaz, ha s — 2, akkor ez az egyenlőtlenség a 
következő alakúra egyszerűsödik: 


H(A) £ I(A) c H(A) —1. (3.15) 
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Egy f : Ah B s elemű kódábécével rendelkező kódot optimálisnak 
nevezünk, ha a lehető legkisebb a kódszóhossza, azaz L(A) a lehető legjob- 
ban megközelíti a elméleti minimumát, H( A) /(loga 5)-et. Az optimális kód 
nem feltétlenül egyértelmű. 
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4. Forráskódoló eljárások 


A következő oldalakon megismerkedhetünk néhány ma is használatos, 
illetve történelmi szempontból jelentős forráskódolási eljárással. 


4.1. Huffman-kód 


A Huffman-féle eljárás a legrövidebb átlagos szóhosszúságú prefix kódolás, 
1952-ben találták ki, és ma is alkalmazzák például a fekete-fehér telefaxok- 
nál és bizonyos képtömörítéseknél. Ahhoz, hogy a módszert alkalmazni 
lehessen, ismerni kell a forrás szimbólumainak előfordulási valószínűsé- 
gét, melyet például a forrás hosszabb ideig tartó megfigyelésével lehet 
meghatározni. Az eljárás minden lépésében összevonjuk a két legkisebb 
előfordulási valószínűségű karaktert egy új összetett karakterré, míg végül 
egyetlen, 1 valószínűségű összetett szimbólumot nem kapunk. Az össze- 
vonások tulajdonképpen egy bináris fát alkotnak, amelynek a gyökere az 
1-es valószínűségű, teljesen összetett szimbólum, az egyes csomópontjai a 
folyamat során előforduló összetett szimbólumok, míg a levelei a kiindulási 
karakterek. Az ágak jelképezik az összevonásokat. Az egyes szimbólu- 
mokhoz úgy rendelünk bináris kódszót, hogy minden összevonás során az 
egyik összevont karakterhez - a bináris fa csomópontjaiból elágazó két ág 
közül az egyikhez - 1-es, a másikhoz 0-s bitet rendelünk, és ezeket a biteket 
egymás elé írjuk. Az algoritmust a legegyszerűbben egy példa segítségével 
érthetjük meg. 


4.1. Példa: Legyen hét átvinni kívánt üzenetkarakterünk, x1, x2, T3, 14, 
xs, 16 és 17. Az egyszerűség kedvéért tegyük fel, hogy már sorrendbe 
rendeztük őket, csökkenő előfordulási valószínűség szerint. Legyen pél- 
dául p(x1) — 0,32, p(z2) — 0,25, p(xr3) — 0,13, p(xra) — 0,10, p(rs5) — 0,09, 
p(z6) — 0,06 és p(r7) — 0,05. (Ha nem csökkenő valószínűség szerint van- 
nak sorban az elemek, első lépéskén sorba rendezhetjük őket.) Készítsük el 
a karakterekhez tartozó Huffman-kódot. 

A kódolás minden lépésében a két legkisebb valószínűségű szimbólumból egy 
összetett szimbólumot képezünk. Az új elemhez a két eredeti szimbólum előfordu- 
lási valószínűségeinek összegét rendeljük valószínűségként. Az így kapott, eggyel 
kevesebb szimbólumot újra sorba rendezzük, s a két legkisebb valószínűségűt újra 
összevonjuk. Addig ismételjük ezt a lépést, amíg végül egy darab, 1 valószínűségű 
üzenetet nem kapunk. Lássuk: 
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Az eljárás, ahogy a végső szimbólumot kaptuk, tulajdonképpen egy bináris fát 
rajzol ki, ahol minden egyes csomópont egy-egy az eljárás során kapott összetett 
vagy egyszerű szimbólum, mint azt a következő ábrán láthatjuk: 








0 
p(x1) — 0,32 űj 

1 D12 — 057 
p(x2) — 0,25 8 ő A 
p(x3) — 0,13 D367 — 0,24 D34567 — 04371 











Rendeljünk a fa gyökerétől visszafelé elindulva minden, az ábrán lefelé forduló 
ághoz 1-es kódelemet, minden felső ághoz 0-t. Ezek a bitek találhatók vastagon 
szedve az egyes ágak fölött vagy alatt. Az x1-es szimbólum kódja így 00 lesz, az 
xo-é 01, az x3-é 100, az x4-é 110, az r5-é 111, az rs-é 1010, az x7-é pedig 1011. A 
Huffman-kódolás nem egyértelmű, nem feltétlenül szükséges az, hogy a felső ágak 
legyenek a nullások, az alsók meg az egyesek, akár lépésenként változtathatjuk a 
szabályt. 

Az egyes szimbólumokhoz a korábbi ábra segítségével is tudunk kódszava- 
kat rendelni. Az egyes összevonásoknak a következő ábrán feltüntetett módon 
lehet biteket megfeleltetni: szintén vastagon szedett 0-k és 1-esek jelölik az ak- 
tuális biteket, a két ábra hozzárendelési szabálya ugyanaz. A kódszavakat ez 
esetben a következő módon határozzuk meg. Végigkövetjük a keresett kiindulási 
szimbólum előfordulási valószínűségét, illetve az abból összevonással keletkezett 
értékeket a diagram minden oszlopán. Példaként egy ilyen folyamat nyomon 
követhető a vastagon szedett számokkal: az z4 szimbólum kódszavának a megha- 
tározása. 
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Amelyik oszlopban az aktuális valószínűség egy másikkal összeadódik, ott a 
mellette bekarikázva található bitet az eddigi kódszóhoz írjuk, méghozzá a kódszó 
elejére. Így a negyedik szimbólumhoz tartozó kódszó 110 lesz. 


4.2. Példa: Vizsgáljuk meg, hogy mennyire lett optimális a kapott kód. 


A kódábécé elemszáma s — 2, így a (3.14) Shannon-féle forráskódolási tétel a 
H(r1i,12,c3,€4t5.16 147) £ L S H(x1.T2 c3.14,€5,€6,€7)-41 (4.1) 
egyenlőtlenséggé módosul. Ebből a forrásábécé entrópiája 


H(xi,T2,x3,14s5 xx) —  —0,3210g20,32 — 0,251oga 0.25 — 0,131og2 0,13 — 
—0,1010g2 0,10 — 0,0910g2 0,09 — 0,06 loga 0,06 — 
—0 0510g2 0,05 — 2,513, 


az átlagos kódszóhossz pedig 


L — 032.-240,52-240,13-3-£0,10 - 3 3-0,09 . 3 4 0,06 - 4 1 0,05 . 4 — 
— 2 54. 


Látható, hogy (4.1) teljesül, sőt az átlagos kódszóhossz elég jól megközelíti az elmé- 
letben elérhető minimális értéket, H(x1,r2,13,14,15,16,17)-t. Az, hogy mennyire 
sikerül a Huffman-féle eljárással kapott kódok átlagos szóhosszával megközelíteni 
az optimumot, attól függ, hogy milyenek a kódolandó szimbólumok előfordulási 
valószínűségei. 


Gazdaságosabb, az optimális kódszóhosszt jobban megközelítő kódokat 
kaphatunk, ha az üzenetet nem betűnként kódoljuk, hanem blokkokat 
építünk a betűkből, és a blokkokat kódoljuk Huffman-eljárással. Általá- 
ban fix számú karakterből álló blokkokat szoktak ilyen célból építeni. 
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4.2. Aritmetikai kódolás 


Az aritmetikai kódolással eleve blokkokat lehet kódolni egy igen látványos 
módszerrel. Első lépésként az A forrásábécé minden A; eleméhez hozzá- 
rendelünk egy 0; — [die.div) intervallumot a [0; 1) intervallumon belül, úgy, 
hogy az intervallumok teljesen lefedjék a [0; 1) intervallumot, viszont ne le- 
gyen közös tartományuk, azaz diszjunktak legyenek. (Diszjunkt halmazok 
metszete üres.) Négyelemű forrásábécére egy példát az alábbi ábra mutat: 


01 02 03 04 





0—gile d1v — d2e d2v — d3e g3v—d4e d40—1 


Egy m elemű blokkot a következőképpen kódolunk: kiválasztjuk 
a [0; 1)-ben az első elemnek megfelelő részintervallumot, ezt jelöljük 
90 IG 9)-veL Ezután 00) lesz az alapintervallumunk, azt oszt- 
juk fel ugyanolyan arányban, mint az első lépésben a (0; 1)-est. Az ábrán az 
így kapott OI új intervallumokat lehet látni az iménti négyelemű forrásábé- 
cé második intervallumában (azaz, ha a blokk első karaktere a forrásábécé 
második eleme volt): 


9V — 02 


! FH 1 
21 22 93 24 

Ezután kiválasztjuk a második karakternek megfelelő 92 — CZ intervallu- 
mot, és azt is felosztjuk ugyanolyan arányban, mint a [0; 1) intervallumot, 
és így tovább, amíg a blokk utolsó, m-edik karakterét nem kódoltuk. Végül 
megkapjuk a már elég kicsi, Am) — Ia" a) intervallumot. Ebből kivá- 
lasztunk egy elemet, és az lesz a kódszavunk. Mivel sehol sem fednek át az 
intervallumok, mindig vissza tudjuk kapni az eredeti blokkot, ha tudjuk a 
forrásábécét és az eredeti felosztási arányokat. 

Ha binárisan kódolunk célszerű a végső intervallumbeli legrövidebb 
bináris törtet kiválasztani kódszónak. Szintén célszerű a gyakrabban előfor- 
duló karakterekhez hosszabb intervallumot rendelni, a ritkábbakhoz pedig 
rövid intervallumokat. Ez esetben ugyanis egy csupa gyakori karakterből 
álló blokkhoz hosszabb 0") intervallum keletkezik, amelyben nagyobb 
eséllyel találunk rövid kódszót. Ez azt eredményezi, hogy a gyakoribb 
blokkokhoz rövidebb kódszavakat fogunk rendelni, azaz jobban tudjuk 
tömöríteni az üzenetet. Nézzünk egy példát. 
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4.3. Példa: Legyen az ai forrásábécébeli elem előfordulási valószínűsége 
pi — 1/2, az a2-é pa — 1/8 az a3-é pedig pz — 3/8. Osszuk fel úgy a [0; 1) in- 
tervallumot, hogy a 0; részintervallumok hossza azonos legyen a hozzájuk 
rendelt szimbólum előfordulási valószínűségével. Ekkor még mindig sza- 
badon megválaszthatjuk a részintervallumok sorrendjét; tartozzon most a 
01 első intervallum az a1 karakterhez, a 092 második intervallum az a2-höz, 
a 093 pedig az a3-hoz. Az osztáspontok így a következő, vastag vonással 
jelölt pontok lesznek: 


91 42 93 
I t t t 1 1 t t j 
0 142 5/8 1 





Kódoljuk az , a2a342a1" blokkot aritmetikai kódolással. 


A blokk első karaktere az az, így a 00 első részintervallum az alábbi ábrán vastag 
vonallal kiemelt [1/2; 5/8) lesz: 


90 
! t ! 8 ! ! ] 
0 1/2 5/8 1 








A 00 tészintervallum hossza I() — 1/8, ezt a kis intervallumot kell az eredeti 
[0; 1) intervallum felosztásával megegyező arányban osztani. Hogy jobban tudjuk 
követni a folyamatot, nagyítsuk ki 0(-et az eredeti [0; 1) intervallummal azonos 
hosszúságúra: 





(2) 
! ] a ké a 
l t : t : AV er, 
1/2 5/8 


Az ábrán vastag vonallal szerepel a blokk második karakterének, az a3-nak megfe- 
lelő részintervallum, melynek végpontja jelen esetben megegyezik a 00) kiindulá- 


si intervalluméval, azaz ag" — 5 /8, a kezdőpontja pedig 


iga b, det oz 
Vg 


2) -145. 1. 387 
de si 2tg8 876 
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A kapott [37/64; 5/8) intervallum hossza I) — 3/64 lesz, ezt megint kinagyít- 
va ábrázoljuk. Az ábrán megvastagítottuk a blokk harmadik karakterének, az 
a2-nek megfelelő 0Ö) szakaszt. 


(8) 
a 90 


1 
37/64 5/8 








A harmadik szimbólumnak megfelelő részintervallum kezdőpontja 


sZ. 1 8. JT 
64 2 64 1287 





1 
a) — 92 2 10) — 


a végpontja pedig 


3/ 5 3 311 
(29 CEE ee ő e . 
64 8 64 512 





5 
19 - 9 a 8 "] 


A blokk utolsó, a1-es szimbólumához tehát az I?) — 3/512 hosszúságú 00) 
intervallum első része fog tartozni, amint az az alábbi ábrán kinagyítva látható. 





(4) 
a T a ] ] 
 SeEEECL OKKKETTTTLKKKTTTüKNTTTETTTE - t t ] 
77/128 311/512 


A 00 intervallum kezdő és végpontjai a következők 





77 
(OR ÁTÓ 
e 128 
m . IT .Ll.3 . 619 
d — 798 2 5127 1024 


Tehát a [77/128; 619/1024) intervallumban keressük a legrövidebb bináris törtet. 
Írjuk át a kezdő és végpontokat bináris tört alakba: 


[1001101; 101101011) 


A két szám bináris alakja egy darabig megegyezik, utána a következő bit a kezdő- 
pontban 0 (vagy semmi), a végpontban nyilván 1 lesz. 


e Ha a kezdőpont a közös résszel befejeződik, akkor ő lesz a jó kódszó, ha nem, 
két eset lehetséges: 


Tartalom ] Tárgymutató S. sz asz 


Információelmélet A Lempel-Ziv-kódolások 
Tartalom ] Tárgymutató SE SG 4385 





e Ha a végpont ezen az 1-esen kívül további számjegyeket is tartalmaz, akkor a 
közös rész egy 1-essel kiegészítve jó kódszó lesz. 

e Mivel az intervallum végpontja nem tartozik az intervallumhoz, ha a szóban 
forgó 1-essel befejeződik a végpont bináris törtje, akkor egy 01 bitpárost kell a 
közös rész után írni, hogy a kódszót megkapjuk. 


A mi esetünkben a 77/1328 és a 619/1024 bináris alakjában az első két bit egyezik 
meg, utána a kezdőpont 0-t, a végpont 1-est és további nem csupa 0 számjegyeket 
tartalmaz, így a második eset áll fenn. Az , a2a3a2a1" blokkhoz rendelt kódszó 
tehát 101 lesz. 


4.3. A Lempel-Ziv-kódolások 


A Lempel-Ziv-kódolásokhoz nem szükséges ismerni a kódolni kívánt szim- 
bólumok előfordulási valószínűségét. Egy adott, véges számú elemből 
felépülő bemeneti üzenetet képezünk egy véges számú elemből álló kód- 
szóhalmazra, úgy hogy a kódolási eljárás során magából az üzenetből dinami- 
kusan generálódnak a kódszavak. Az eljárások alapötlete az, hogy a bemeneti 
szimbólumsorozatot különböző blokkokra bontjuk, miközben folyamato- 
san elraktározzuk a már látott blokkokat egy szótárban. A még nem látott 
blokkoknak lényegében csak a már látottaktól való eltérését tároljuk. 

Például az LZ78 algoritmus az alábbiak szerint épül fel. A szótár láncolt 
lista szerkezetű, minden sorában az egyik oszlopban a sor címkéjét (m), 
a másikban az előzmény sorcímkéjét (n), a harmadikban pedig az utolsó 
karaktert tároljuk. A kódolás elején a szótárban csak a nulladik sora van 
meg, az természetesen n — 0-ra mutat és üres a szimbólum mezője. Amíg 
el nem fogynak a szimbólumok, minden lépésben beolvassuk a következő 
karaktert. 


e Ha az a karakter még nem szerepel a szótárban, akkor csinálunk egy 
új sort neki, amelynek a mutató része a nulladik sorra mutat, a címe 
pedig eggyel nagyobb, mint az eddig szerepelt maximális cím. 


Ha szerepel a beolvasott karakter azon sorok valamelyikében, ame- 
lyik a nulladik sorra mutató n-nel rendelkezik, megjegyezzük azt az 
m-et, amelyik sorban van. Ha már van megjegyzett m címünk, akkor 
természetesen azok között a sorok között keressük a beolvasott karak- 
tert, amelyek a megjegyzett címre mutatnak, nem pedig az n — 0-s 
sorokban. 


Ha szerepel a karakter a szótárban, de nincs olyan, az utolsó megjegy- 
zett m-re mutató sor, amelyiknek a bejegyzése az aktuális karakter, 
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akkor nyitunk neki egy sort, amelyiknek a sorszáma eggyel nagyobb 
lesz, mint az utolsó sor száma, a mutatómezeje a megjegyzett m-edik 
sorra fog mutatni. 


Minden szótársor nyitása után a megjegyzett sorszám 0-ra áll vissza. Ezeket 
a lépéseket addig ismételjük, amíg el nem fogy az üzenet, vagy be nem 
telik a szótár. A szótár maximális méretét ugyanis többnyire meg szokták 
adni. Vegyünk egy példát! 


4.4. Példa: Legyen három karakterünk, a, b és c. Kódoljuk LZ78-as algorit- 
mussal az abaabaabaccbabcabcaacba üzenetet. 
A szimbólumsorozat alatti kapcsok jelzik az egyes lépéseket, 


a b aa ba ab a c cb abcabca ac ba 
SNS SZ SZ ŰZ XS ER E E 


a kapott szótár: 


m szimbólum sorozat 





n 

0 

0 a 
0 b 

1 aa 
2 ba 
2 ab 
1 — a 
0 

6 

5 

8 

1 

4 


OH OWEDBVDEO 


en a nme 


c 

cb 
abc 
abca 
ac 


— ba 


NOT 
€3 BTs 8. 


[szelő edes] 


0 


Ahhoz, hogy a szótárat és az üzenetet reprodukálni tudjuk, elegendő az ,n" és 
a , szimbólum" oszlopok ismerete. Előfordulhat, hogy új karakter előtt, vagy az 
üzenet végén nem befejezett, frissen elraktározott karakterláncunk van, hanem 
egy olyan, amely már szerepel a szótárban. Ilyen esetekben nem kell új szótársort 
nyitni, csak az utolsó megjegyzett sorszámot kell a dekódoló tudtára adni, meg 
azt, hogy nem került bejegyzés a szótárba. Ugyanez a teendő, ha a szótár elérte az 
engedélyezett méretét; ekkor nem történik több bejegyzés, csak a meglévő sorok 
között válogatunk. 


A továbbfejlesztett, LZW-eljárás nagyobb tömöztítést tesz lehetővé. A 
szótár első soraiban felsorolják az összes, az üzenetben előforduló szimbó- 
lumot, ezeket a dekódoló is ismeri a folyamat elejétől kezdve. A tényleges 
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szótárépítés során nem használják többé a tényleges karaktereket, csak az 
őket tartalmazó szótársor sorszámát. A módszer fő eltérése az LZ78-astól 
az, hogy egy-egy új szótársor megnyitása után nem nullára áll vissza az 
utolsó megjegyzett sor sorszáma, hanem a legutolsó karaktert rejtő sor 
sorszámára. Ez azért előnyös, mert az utolsó karakter a következő sorozat 
része lesz, így azt nem kell ismertetni a dekódolóval. 


4.5. Példa: Nézzük az előbbi példát az LZW-algoritmussal kódolva. 
Az üzenet : 


adta att szállsz " azás SS zzz " szzéuma Mvt 


abaabaabaccbabcabcalacba 
Sz Ke VR RK 


a kapott szótár: 








m n szimbólum sorozat kimenet 
0 0 — — 

1 0 a — sa 
2 0 b Ha sb" 
3 1 c — eléd 
4 2 b ab 1 
5 1 a ba 2 
6 4 a aa 1 
7 6 a aba 4 
8 6 b aab 6 
9 5 c bac 5 
10 3 c cc 3 
11 3 b cb 3 
12 5 b bab 5 
13 2 c bc 2 
14 3 a ca 3 
15 4 c abc 4 
16 14 a caa 14 
17 1 c ac 1 
18 11 a cba 11 
— — — a 1 


A vízszintes vonal határolja a definiáló és az érdemi részt. Az üzeneten kapcsos 
zárójelek jelzik az egyes lépéseket. 


Természetesen, mivel a szótár az üzenethez kötődik, s minden egyes 
szimbólumsorozatra más és más lesz. Látható, hogy ha tömörítésre sze- 
retnénk ezt az algoritmust használni, rövid üzenetet nem érdemes így 
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kódolni, hiszen a szótár felépítése az üzenet elején nagy mennyiségű plusz 
adatot generál, anélkül, hogy lényegesen csökkentené az üzenet hosszát. 
Nagyobb méretű üzenetet azonban igen jó arányban lehet tömöríteni ezzel 
a módszerrel. Ennek az az alapja, hogy a Lempel-Ziv-algoritmusokkal 
generált ,kódszavak" körülbelül egyforma valószínűséggel fordulnak elő 
a szövegben. 

A Lempel-Ziv-kódolások során a szótárakat nem engedik a végtelensé- 
gig nőni, egy idő után csak a már meglévő elemekből építkeznek. A szótár 
méretének csökkentését segíti elő az is, hogy a nagyon ritkán használt 
sorokat törlik, helyettük gyakoribbakat töltenek be. 
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5. Forráskódolás a gyakorlatban 


5.1. A mintavételezésről és a kvantálásról 


A hangok és képek időben és intenzitásban is folytonos függvényekkel 
írhatók le. Az analóg hírközlésben ezeket a jeleket — kisebb módosítások- 
kal - valamilyen moduláció segítségével ráültetik egy adott frekvenciájú 
szinuszos vivőjelre. 

Digitális hírközlés során ezeket a leíró függvényeket valamilyen módon 
időben és intenzitásban is diszkrét jelekké kell alakítani. Ez az átalakítás, 
ha ügyesen csináljuk, szintén lehetőséget biztosít tömörítésre, entrópianö- 
velésre. 

Az első lépés az időbeni mintavételezés. Vegyünk egy f(t) függvényt. 
Ennek a T mintavételi idővel vett mintavételezettje az 


f(to) f(to tk T),f(to 7 27),f(to Hul 37), jelei (5.1) 


számsorozat. Sok esetben to — 0. 

A mintavételi idő meghatározása alapvető feladat, hiszen ha túl nagy 
időközönként veszünk mintát, akkor sok információt veszíthetünk a jel- 
ről, és nem leszünk képesek azt visszaállítani. Ha igen kis időközönként 
veszünk mintát, akkor túl sok pontunk marad, kicsi lesz a (5.1) sorozat 
entrópiája, nem lesz elég nagy a tömörítés, pedig a mintavételezésnek ez 
is célja. A mintavételezési tétel a mintavételezési frekvenciának ad alsó 
korlátot — a mintavételezési időnek felső korlátot. Vegyünk egy olyan je- 
let, amely frekvenciatartományban korlátos, azaz amelynek egy 5-[—B, B] 
frekvenciaintervallumon kívüli összetevői (jó közelítéssel) nullák. Az ilyen 
jeleket B sávra korlátozottaknak nevezik. A mintavételezési tétel szerint 
egy B sávra korlátozott jelre a mintavételi idő 


TT 

Té (5.2) 
legyen. Ez azt jelenti, hogy a mintavételezés frekvenciája legalább a jel- 
ben szereplő maximális frekvencia kétszerese kell, hogy legyen. A tétel 
bizonyításával nem foglalkozunk, de néhány ábrával demonstráljuk ér- 
vényességét. Mindhárom ábrán a mintavételezett szinuszos jel folytonos 
vonallal, a mintavételezési pontokban vett értékei pedig sötét pöttyökkel 
szerepelnek. Az első ábrán kellően kicsi mintavételezési időt használtunk, 
a jelalak visszaállítására van esély: 
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A második ábrán egy a szükséges mintavételezési frekvenciánál kicsit ki- 
sebb frekvenciával mintavételeztük a jelet, ah harmadikon pedig a szükséges 
mintavételezési idő kétszeresénél is nagyobb időintervallumonként: 


Látható, hogy a második és harmadik esetben a jelalak visszaállítása nem 
lehetséges — feltéve, hogy nem tudjuk eleve, hogy alul mintavételeztünk. 
Mindkét esetben, a mintavételezési pontok helytelen megválasztása miatt, 
egy sokkal kisebb frekvenciájú jelre következtethetünk a mintavételezési 
pontokban felvett értékekből. (Bizonyos esetekben ki szokták használni, 
hogy az alul mintavételezett periodikus jelek hasonlítanak az eredetijükre, 
csak a frekvenciájuk más. Ilyen eset, ha közelítőleg ismerik a jel frekvenciá- 
ját, és a mintavételező annál csak kisebb frekvenciákra képes.) 
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Ha digitálisan szeretnénk továbbítani vagy tárolni az információt, ak- 
kor a mintavételezés utáni folytonos (5.1) értékeket valamilyen módszer- 
rel diszkretizálni kell. Azt az algoritmust, amellyel a jelünket leíró f(t) 
függvény folytonos értékkészletét nem átfedő, de összességében a teljes 
értékkészletet lefedő intervallumokra bontjuk, majd ezekhez az intervallu- 
mokhoz egy-egy - többnyire binárisan jól ábrázolható — számot rendelünk, 
kvantálásnak hívjuk. A kvantálást többnyire egy 0(y) függvénnyel repre- 
zentáljuk, melynek értelmezési tartománya a lehetséges kvantálandó v; 
jelek halmaza (általában egy zárt, de folytonos intervallum), értékkészlete 
pedig véges sok számból áll. Igen kézenfekvő például a következő lépcsős 
függvényt választani kvantálónak: 


A(y) 


Az ilyen kvantálók a lineáris kvantálók. Természetesen ez az egyszerű függ- 
vény többnyire nem tömörít elég gazdaságosan, hiszen például az ember 
fül vagy szem nem egyformán érzékeny a különböző intenzitású hangra, 
illetve fényre. Ezért többnyire vagy bonyolultabb kvantálást alkalmaznak, 
vagy pedig kvantálás előtt megfelelőképpen transzformálják a jelet. 

A kvantálást lehet jellemezni a négyzetes torzítással, ami tulajdonkép- 
pen az eredeti számsornak a kvantált számsortól vett eltérésnégyzeteinek 


várhatóértéke: 
N 


D(0) — z 93 (vi — 0w?) : 


i—1 
Egy jó, az alkalmazáshoz illeszkedő kvantáló megszerkesztése bonyolult 
feladat. 
Ha a kvantálás végeredménye nem bináris szám, viszont bináris jele- 
ket szeretnénk eredményül, egy újabb hozzárendeléssel kell megoldani a 
problémát. 
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5.2. A hang kódolása 


A modernebb hangtömörítő eljárások figyelembe veszik az emberi hallás 
sajátosságait. Az emberi hallás leírására a frekvenciatartományban áll- 
nak rendelkezésre jó modellek, ezért általában a frekvenciatartományban 
analizálják a hangokat. 

Jó közelítéssel 20 Hz és 20 kHz közötti frekvenciájú hangokat hallunk. 
Az igen alacsony és az igen magas frekvenciájú hangokra azonban sokkal 
kevésbé érzékeny a fülünk, mint a 2 és 4 kHz közötti tartományban, ezért 
a hallható frekvenciatartomány szélein sokkal nagyobb torzítást engedhe- 
tünk meg: ott sokkal nagyobb lépésközű kvantálónk lehet, mint a középső 
frekvenciatartományban. Ezen kívül egy nagy intenzitású hang a fülünk 
számára elfedi, maszkolja a hozzá közeli frekvenciájú halkabb hangokat, 
ha azok vele egyidőben szólnak. A maszkolás tulajdonképpen a nagy 
intenzitású hang bekapcsolása előtti rövid, kb. 2 ms-os, és kikapcsolása 
utáni kb. 15 ms-os időintervallumra is kiterjed. Mindezek következménye- 
ként nem kell minden frekvenciatartománybeli hangösszetevőt egyforma 
felbontással kvantálni, illetve bizonyos összetevők el is hagyhatók. 

A CD-k kevésbé használják ki ezeket a lehetőségeket, az egyes hangcsa- 
tornák (sztereó hangzás esetén például a jobb és a bal oldali hangcsatorna) 
jeleit általában 44,1 kHz frekvenciával mintavételezik. A mintavételezett 
jelet lineáris kvantálóval 2 bájtra kvantálják, majd megfelelő eljárással rög- 
zítik. A filmek hangtömörítő eljárásai — mint az MPEG Layer1, 2, és 3 
elnevezésű algoritmusai — egyre jobban kihasználják a maszkolás jelensé- 
ge által nyújtott lehetőségeket. A filmek hangjait 32, 44,1, vagy 48 kHz 
frekvenciával mintavételezik, majd a teljes frekvenciasávot 32 részsávra 
bontják. Minden részsávban elvégeznek egy a maszkolásokat figyelembe 
vevő transzformációt — a különböző részsávokban különbözőket -, majd a 
részsávnak megfelelő finomsággal kvantálnak. A fejlettebb algoritmusok 
(például az MP3) a részsávokat tovább bontják, jobb, a maszkolást jobban 
figyelembe vevő transzformációkat használnak, a lineáris kvantáló helyett 
a feladathoz jobban illeszkedőt alkalmaznak, illetve a kimeneti jeleket még 
egy általános forráskódolási eljárással (például Huffman-kóddal) tömörítik 
is. 


5.3. Állóképek fekete-fehérben és színesben 


A képek digitális feldolgozásakor az első lépés a kép területének apró négy- 
zetekre, pixelekre, való felbontása. Ha a képek mozgókép részei, akkor a 
pixelek száma meghatározott (720 x 480, az NISC szabvány szerint, illetve 
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768 x 576 a PAL szerint), egyébként tetszőleges lehet. mozgóképeknél 
szükséges adat a képfrissítési frekvencia is. Fekete-fehér képeknél az egyes 
pixelekhez csak egy adatot rendelnek hozzá: a képpont világosságát, míg 
színes képeknél (néhány eset kivételével) több értéket is: a vörös, zöld és 
kék színek intenzitását az adott pontban, vagy a világosságot és még két 
színkoordináta értékét. A színtérben való kvantálást a színmélység jellem- 
zi, amely azt mondja meg, hogy egy pixel leírására hány bitet használunk. 
Általában 8 vagy 24 bit szokott lenni a színmélység. 


Az emberi szemben található receptorok (csapok és pálcikák) a 360 nm 
és 830 nm közötti hullámhosszú fényre érzékenyek. Általában a három 
különböző hullámhossz-tartományú fényre érzékeny háromféle csap ala- 
kítja ki főként a látást, mindegyiknek az intenzitásra való érzékenysége 
közel lineáris (legalábbis egy tartományon belül). A szem általában a fé- 
nyességbeli eltérésekre jobban reagál, mint a szín eltéréseire. Könnyebben 
észreveszünk egy halványabb mintázatot, hogyha az ritkább, mintha sű- 
rűbb, tehát a különböző térbeli frekvenciával rendelkező képösszetevőkre 
sem egyforma a szem érzékenysége. Sok helyen ezt ki is használják, a 
nagyobb térbeli frekvenciájú komponenseket elhagyják, főleg, ha például 
filmben csak rövid ideig jelenik meg. 

A színeket két különböző, de egymásba transzformálható, három kom- 
ponensű vektorral szokták leírni. A televíziókban általában egy pixelhez 
három különböző színű pont (például elektronok által besugárzott foszfor- 
pötty, világító tranzisztor) tartozik: piros, zöld és kék. Attól függően látjuk 
a képpontot valamilyen színűnek, hogy az egyes pöttyök milyen intenzi- 
tással világítanak. Az RGB (red, green, blue) paraméterek mindegyikét 
legtöbbször nyolc biten kvantálják, ez általában elegendően finom osztás, 
224. féle színt képes megkülönböztetni. Ez a három paraméter helyettesít- 
hető másik hárommal, az Y luminanciával, amely a képpont fényességét 
írja le, és a két krominanciával, C,-rel és C-vel, amelyek a színérzetért 
felelősek. Mivel a szem a fény intenzitására érzékenyebb, mint a színre, az 
utóbbiak kvantálásakor nagyobb torzítást engedhetünk meg, mint Y-nál. 


5.3.1. A GIF (Graphics Interchange Format) szabvány 


Ez a szabvány nem hagy el részleteket a képből, a soronként letapo- 
gatott, mintavételezett, kvantált jelsorozatot tömöríti egy Lempel—Ziv- 
algoritmussal. A színeket indexelt tárolással kezeli. Ez azt jelenti, hogy a 
színértékekből (azok RGB koordinátáiból) táblázatot alakít ki, és az egyes 
képpontokhoz csak a megfelelő elem címkéjét kell eltárolni. Az így kapott 
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szimbólumsorozatot tömörítik LZW algoritmussal. Mivel a táblázatot — 
melyet ez esetben palettának hívnak - és a Lempel-Ziv-kód szótárát el kell 
raktározni, egy ilyen tömörítés csak kellően nagy képeknél tud kifizetődni. 

Akkor célszerű ezt az algoritmust használni, ha a képen csak kevés 
szín van, így kicsi lesz a paletta. Hatékony a módszer akkor is, ha egy-egy 
szín nagyobb felületeket tölt ki, hiszen ilyenkor a Lempel-Ziv-tömörítés a 
hosszan ismétlődő szimbólumokat egy rövid kódszóba viszi. Ilyenek példá- 
ul a számítógépeken szereplő ikonok: kevés színből építkeznek és egy-egy 
színt nagy, kiterjedt felületen használnak. A palettát lehet mesterségesen 
is csökkenteni: egy olyan szín helyett, amely még nem szerepel a táblá- 
zatban, lehet egy hozzá közeli, már szereplő színre mutatni. A fényképek 
tömörítésére a módszer nem igazán megfelelő. 

A tömörített kép elején közlik a kép méretét, és a paletta elemeinek 
megcímkézésére használt bitek számát. A paletta a kódolás során folya- 
matosan nőhet, ha alulbecsültük az elején a szükséges színek számát, és 
tele lesz a táblázatunk, a program megduplázza annak méretét, és eggyel 
megnöveli a címkézésre felhasznált bitek számat. Csak addig dupláz, amíg 
a felhasznált színek száma el nem ér egy korlátot (2!?), utána már csak a 
palettán szereplő színekkel közelít. 


5.3.2. A JPEG (Joint Photographic Experts Group) szabvány 


A nyolcvanas évek közepén összefogott az International Telecommunica- 
tion Union (ITU) és az International Organisation for Standardization (az 
IS0) néhány hozzáértő embere, hogy létrehozzon egy szabványrendszert a 
színes és fekete-fehér állóképek tömörítésére. A két szervezetből alakult 
csoport nevezte magát, illetve az általuk kidolgozott és összegyűjtött kódo- 
lásokat JPEG-nek. A szabvány keretet kínál veszteségmentes és veszteséges 
tömörítésre is. 

A veszteségmentes tömörítési eljárásuk egy úgynevezett prediktív kódo- 
lás (predikció — jóslás), amely az egy képponthoz tartozó intenzitásértékek 
helyett csak azoknak egy az intenzitást becslő értéktől való kis eltérését 


4. 


tárolja el. A becsült értéket mindig már meglévő szomszédos képpontok 


4.4 


intenzitásaiból állítják elő. A képnél egy pixel már meglévő három szom- 
szédos képpontja a fölötte, az előtte és az előtte átlósan felfelé lévő pont. 
Ha elég jó az ezekből — például ezek számtani közepeként - származtatott 
becslés, akkor igen kicsi eltérést kell eltárolni, ami természetesen kevesebb 
tárat igényel. A kapott eltéréseket egyfajta aritmetikai kódolással tömörítik. 


A veszteséges kódolásoknál először előállítják és különválasztják a 
három képsíkot (az Y luminanciát és a két C,. és Cs krominanciát). A JPEG 
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teljesen elszeparálva kezeli a három képsíkot; egy színes kép helyett három 
egyszínűt használ. Azt megengedi, hogy a három képsík más és más térbeli 
felbontást használjon. Mindhárom színt 8 — 8 biten tárolják képpontonként, 
de egy-egy képpont a két krominancia-képben általában nagyobb, mint 
a finomabb térbeli felbontású luminancia síkban. Ezek után a kódoló a 
következő lépéseket hajtja végre: 


Felbontja a képeket 8 x 8 pixeles négyzetekre, úgynevezett csempékre. 


minden csempét diszkrét koszinusz transzformációnak vet alá. Így kap 
a frekvenciatartományban egy valós számokból álló sorozatot. 


A kapott valós számsorozatot újfent kvantálja, hogy egész értékei legye- 
nek. A kvantáló egyenletes, de a lépésköze a csempe minden elemére 
(a csempében található különböző frekvenciájú tagokra) más és más 
lehet. A csempe elemei úgy helyezkednek el, hogy kisebb frekvenciás 
tagok — amelyekre a szem érzékenyebb - a bal felső sarokba kerül- 
nek, őket szokás kisebb lépésközzel kvantálni, a nagyobb frekvenciás, 
jobb alsó elemeket nagy lépésközzel. Az egyes elemekre vonatkozó 
kvantálási lépésközöket is el kell tárolni egy táblázatban. 


A nagyfrekvenciás, majdnem nulla elemeket a csempében elhagyja 
a tömörítő eljárás. Így tehát a csempe jobb alsó sarkában szinte csak 
nulla van. Annak érdekében, hogy ezek egy hosszú nullákból álló 
sorozatot alkossanak, amelyet könnyű kezelri, a JPEG a következő 
kiolvasási sorrendet használja: 
























































Az úgynevezett futamhossz-kódolás során a kapott, sok nullát tartalmazó 
sorozatot úgy bontják részekre, hogy minden részsorozat valamennyi 
(lehet nulla is) nullával kezdődjön, és egyetlen nem nulla elemmel 
végződjön. Egy ilyen részsorozathoz hozzárendel a kód három számot: 
a nullák számát, a nem nulla elem leírásához használt bitek számát 
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és a nem nulla elem értékét. Látható, hogy a különböző értékeket 
különböző bit pontossággal lehet a JPEG-en belül tárolni. 


e Végül Huffman-kóddal tömöríti a kapott számhármasokból az első két- 
két elemet. A Huffman-kódot nem lehet megválasztani, az rögzített a 
szabványban. Későbbi verziókban aritmetikai kódolás is lehetséges. 


Ha egy 24 bit/képpontos képet JPEG-gel tömörítenek képpontonként 2 bi- 
tesre, a különbség alig észrevehető. 

A JPEG2000 szabvány alapvető újdonsága az, hogy diszkrét koszi- 
nusz transzformáció helyett wavelet-transzformációt alkalmaz. A wavelet- 
transzformáció képes arra, hogy helyről helyre különböző frekvenciájú 
felbontást használjon, az éles határvonalakon lokálisan finomabb felbontás 
lehetséges, mint a homogénebb háttéren. Ha azonos tömörítési arányt 
használunk, az éles vonalak kevésbé elmosódottak JPEG2000-rel, mint az 
eredeti JPEG szabvány esetén, amely az egész blokkot egyféle felbontási 
szinten kezelő koszinusz transzformációt alkalmaz. 


5.4. Mozgóképek 


A hagyományos videoszalagra minden képkockát egyforma számú bittel 
írtak le, így a folytonos szalagolvasási sebesség folytonos filmnézést tett 
lehetővé. Lehetetlen volt azonban a — mintavételezés és a kvantálás finom- 
ságának megválasztásán túl — a mozgóképet tömöríteni, így a filmeket 
leíró fájlok igen nagyok voltak. A videoszalag hosszát a film hosszának 
megfelelőre vágták, azt oda-vissza le lehet játszani, és odébb is lehet tekerni. 
A CD-k majd DVD-k megjelenése tette szükségessé a mozgókép-tömörítést, 
hiszen azokat nem kell feltétlenül állandó sebességgel forgatni. 

Az MPEG, a Moving Picture Experts Group az ISO egy csoportja, amely 
a veszteséges mozgókép-tömötítés szabványosításával foglalkozik. Ezen 
szabványokat mind a digitális televíziózásban, mind a filmeknél, mind 
pedig az interaktív multimédiás alkalmazásokban használják. Mivel egy 
mozgókép mintavételezése és kvantálása rendkívül nagyméretű adatfolya- 
mokat eredményez, igen nagy tömörítésre van szükség. 

Az MPEG-gel kódolt bitfolyam különböző részekből tevődik össze. 


e A legbővebb halmaz a videoszekvencia, amelynek a fejléce tartalmazza 
a képméretet, képsebességet és a képsorozat fontos paramétereit. 


e A videoszekvencia képcsoportokból áll. Egy képcsoport több, egymás 
utáni kép. Minden képcsoportot külön, egymástól függetlenül kódol- 
nak. 
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e A képeknek három típusát különbözteti meg a szabvány, ezeket a 
típusokat I-vel, P-vel és B-vel jelöli. 


e A képek sávokból állnak, és a sávok elején mindig ugyanaz a bitsorozat 
található, hogy ha valamilyen adatátviteli hiba lép fel, akkor is tudja a 
dekódoló, hogy hol vagyunk, azaz képes legyen a jellel szinkronizá- 
lódni. 


Egy sáv 16 makroblokkból épül fel, egy-egy makroblokk 16 x 16 képpont 
leírására szolgál. 


e A makroblokkok mindegyike 6 blokk együttese. Minden blokk 8 x 8- 
as mátrix. Két blokk írja le a két krominanciát, a maradék négy a 
luminanciát, amelyet kétszer finomabb térbeli felbontással kezel a kód. 


Egy mozgóképben általában az egymást követő képek csak kis mértékben 
térnek el egymástól, így elvileg szükségtelen lenne minden képkockát 
tárolni, elegendő lenne csak a hasonló képek közül az elsőt, és aztán a 
többinek csak az ettől való eltérését. A különbség kódolása a gyakorlatban 
úgy történik meg, hogy az egyes makroblokkokhoz megkeresik az előző és 
esetleg a következő képeken az adott makroblokkra leginkább hasonlító 
részletet, megjegyzik, hogy a vizsgált makroblokk mennyire van eltolva 
azokhoz képest, és hogy a makroblokk mennyiben tér el az azokból becsült 
értéktől. (Az azokból becsült érték lehet egyszerűen a megelőző képen 
a hasonló részlet értéke, de lehet több környező képből képzett átlag is.) 
Minden - nem vágás utáni - kép egy makroblokkjának kódolásához tehát 
hat különbségekből álló kis méretű blokk és két mozgásvektor tartozik. A 
blokkokat aztán lehet a JPEG-hez hasonló módon tömöríteni. 

Ha így kódolnánk, nem lenne lehetőség a filmbe akárhol bekapcsolódni, 
mindig csak a vágások elején, mert az egész képsorozat dekódolásához 
kellene a legelső kép. Hogy mégis bárhol el lehessen kezdeni nézni a moz- 
góképet, bizonyos lépésközönkérnt a teljes képkockát meghagyják, és azt 
tömörítik a JPEG-hez hasonló módon. Az ilyen képkockákat jelölik I-vel, és 
a két I típusú filmkocka közötti képek alkotják a képcsoportokat. Az egyes 
képcsoportok további részekre bomlanak. Minden harmadik elemet csak 
az azt hárommal megelőző képből származtatják. Ezek a P típusú képek, és 
csak egyetlen, (vagy P, vagy I típusú) képből eredeztethetők. A többi képet 
az időben eggyel előttük és az eggyel utánuk lévő P vagy I filmkockából 
származtatják, ezek a B képek. A B típust nem használják fel másik B-kép 
kódolásakor, mert úgy előfordulhatna, hogy oda-vissza utal a két kocka 
egymásra, és nem lehetne dekódolni. Az alábbi ábra szemlélteti az egyes 
képkockák egymásból származtatását. A duplán bekeretezett kockák az I 
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típusúak, a vastag vonallal rajzolt üresek a P típusúak, a vékony vonala- 
sok B-képek. A nyilak az előállított képkockákba mutatnak a becsléshez 
felhasznált kockákból. 









































p- -a p- -a e 70— 
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Nem kötött, hogy két I-kép között hány P-típusú helyezkedik el, így lehet 
a vágásokat s a hosszabb állóképeket gazdaságosan tömöríteni. Gyakran 
használják az ábrán látható két P-s sémát. Látható, hogy egyetlen kép 
sem hivatkozik a két I által meghatározott zárt intervallumon kívülre, így 
igen minimális számolással bárhová be lehet csatlakozni, bárhonnan el 
lehet kezdeni nézni a filmet. Ezt szolgálja az is, hogy a B képeket a kódolt 
adatfolyamban hátrébb tolják, közvetlen az előállításukhoz szükséges I 
vagy P típusú kocka mögé úgy, hogy ha csak a B-k sorrendjét nézzük, ne 
legyen keveredés. Ha így rendezzük a filmkockákat, akkor mindig csak 
egy irányba (visszafelé) kell keresni a előzményeket, így az adatfolyam 
könnyebben kezelhető. Kiolvasáskor természetesen a dekódoló tudja, hogy 
az adott B képet hamarabb kell levetíteni. 
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6. Út a csatornán át — a digitális modulációról és a 
döntésről 


6.1. A digitális modulációról 


Eddig igen absztrakt szimbólumok hordozták az információt, de nyilván 
kevés csatorna képes például 0-s és 1-es számokat, vagy a, b, c betűket 
továbbítani. A csatornák általában valamilyen típusú jelek átvitelére al- 
kalmasak, így az absztrakt szimbólumoknak különböző paraméterekkel 
jellemzett elektromos áramot, mágnesezettséget, elektromágneses hullá- 
mot, vagy például kristályszerkezeti állapotokat kell megfeleltetni. Ha 
például egy időintervallumban folyt áram a vezetőben, azt vehetjük 1-es 
bitnek, ha nem - illetve csak egy referencia értéknél kisebb folyt —, 0-nak. 
Hasonlóképpen, egy mágneses lemez vagy szalag adott pontján a mág- 
nesezettség két iránya, míg az optikai lemezek (CD, DVD) pontjaiban az 
anyag kristályos vagy amorf szerkezete, és így két különböző fénytörési 
jellemzője feleltethető meg a két bitnek. 

Az elektromágneses hullámok sokkal több lehetőséget tartogatnak an- 
nál, hogy van hullám, vagy nincs. A fény- és rádióhullámok három fő 
jellemzővel írhatók le: a frekvenciájukkal, az amplitúdójukkal és a fá- 
zisszögükkel. Mindhárom hordozhat mind digitális, mind pedig analóg 
információt, melyek közül az előbbivel fogunk foglalkozni. A modulált jela- 
lakok leírhatók egy adott wa körfrekvenciájú, Ag amplitúdójú, po fázisszögű 
harmonikus jel (.Ao sin(wot -- p)), az úgynevezett vivőjel különböző mó- 
dosításaiként. A digitális moduláció alapötlete az, hogy az időt diszkrét, 
nem átfedő, 7 hosszúságú intervallumokra bontjuk, a szimbólumainknak 
megfeleltetünk egy-egy rendelkezésre álló 77" hosszúságú jelszakaszt, és 
az i-edik időintervallumban az i-edik szimbólumhoz hozzárendelt jela- 
lakot adjuk le. Az idő intervallumokra való felbontásához szükség van 
egy órajelre, s az órajel frekvenciáját a demodulátorban is ismerni kell. 
Ezen kívül a demodulátor szinkronban működik a modulátorral, ismeri a 
rendelkezésre álló jelalakokat és a vivőjelet, ezek alapján dönt arról, hogy 
melyikhez hasonlít legjobban a vett jel, melyik szimbólumnak megfelelő 
jelalakot adhatták le. 


6.1.1. Impulzus amplitúdómoduláció — PAM 


Az amplitúdómoduláció során az Ag sin(wot -- 0) vivőjel amplitúdóját vál- 
toztatják meg a 
vi (t) — a; : Ag sin(wot -- p) 
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formula szerint, és az i-edik bithez y;(t)-nek a t e [0,7) intervallumbeli 
szakaszát feleltetik meg. A bináris amplitúdómodulációnál lehet például 
ao — Oés ai — 1, vagy ag — -—1 és ai — I, a négyes AM esetén a négy 
különböző érték ag — —2, az — —1, az — 1 és az — 2. Illusztrációként álljon 
itt az 10010111 bitsorozatból második típusú modulációval létrejött jel (ha 
a T éppen a vivőjel periódusideje): 





és a 20231203 szimbólumsorozatból a fent leírt módon négyes amplitúdó- 
moduláció segítségével létrehozott jel: 


Az ábrákon két függőleges szaggatott vonal határolja az egyes időinter- 
vallumokat. Az amplitúdófaktorok lehetnek komplex számok is, ekkor a 
jelnek nem csak az amplitúdója, hanem a fázisa is módosul. 


6.1.2. Fázismoduláció — PSK 


Az fázistolásos moduláció a harmonikus Ap sin(wot -- p) vivőjel fázisát 
változtatja meg, így a modulált jel [i7,(i 4 1)7T) szakasza 


vi (t) — Aosin(wot 4 p 4 4) 


lesz aszerint, hogy az i-edik pozícióban melyik szimbólum volt. Tipiku- 
san a 3607-ot 2" egyenlő részre osztják, ezeknek felelnek meg a 4;-k. A 
bináris fázismodulációnál (BPSK) 4o — 09, 4i — 18097, a kvadratúra fá- 
zismodulációnál (OPSK, vagy 4PSK) 49 — 09, W4i — 907, 42 — 1807 és 
13 — 2709, a 8PSK-nál pedig 49 — 09, bi — 459, a — 909, 43 — 135", 
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a — 1807, 4; — 225", 4e — 270" és 4 — 3157. Illusztrációként a 20231103 
szimbólumsorozatból OPSK-val létrehozott jel: 


6.1.3. Frekvenciamoduláció — FSK 


Ezek után könnyű rájönni, hogy az i-edik szimbólumhoz rendelt, frekven- 
ciamodulált jelalak 


vi(t) — Aosin((wo TF az : we)t b 9) 


lesz. A bináris frekvenciamodulációra például ag — 1, az — —1. Ha 
wc — wo /4, akkor az 10010111 bitsorozatból a 





jelet kapjuk. 


6.2. A csatorna megosztásáról 


A hírközlési csatornák véges sávszélességűek, így mivel igen sok felhasz- 
náló szeretne egyszerre egy csatornát használni, azt valamilyen módszerrel 
meg kell osztani. Azokat az eljárásokat, amelyek lehetővé teszik azt, hogy 
a jelátvitel csoportosan, a csatorna megosztásával történjen, nyalábolási 
vagy multiplexelési technikáknak hívjuk. 

Egy közös csatornát frekvenciában és időben is meg lehet osztani. A 
frekvenciaosztású multiplexelés, vagy FDM (Freguency Division Multip- 
lexing) a csatorna frekvenciasávját több alsávra bontja. Olyan modulációkat 
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alkalmaz, amelyek az átvinni kívánt több adatfolyamból egy-egy szimbó- 
lumsorozatot csak egy alsávba visznek. Az egyes vevők tudják, hogy 
az őket érdeklő információ milyen frekvenciatartományban található, és 
annak megfelelő sávszűrőre vezetik először a vett jelet. Ha több felhaszná- 
ló egy csatornát használhat, a csatorna frekvenciaosztással többszörösen 
hozzáférhető, vagy FDMA (Freguency Division Multiple Access). 

Az időosztással többszörösen hozzáférhető IDMA (Time Division 
Multiple Access) csatornákon működő rendszerek, egy-egy felhasználónak 
csak bizonyos időintervallumokban engedik az információ adását és vételét. 


A fenti két módszer lényegében azt eredményezi, hogy hiába találkoz- 
nak és adódnak össze a különböző jelek a csatornán belül, a vevők nem 
fogják azt érzékelni, mert a sávszűrőjük elnyomja az idegen jeleket, illet- 
ve időosztásos multiplexelésnél az ő időintervallumaikban mások nem 
adhatnak. Lehetséges azonban az is, hogy az egyes felhasználópárok a 0 
és 1 bitjeiket csak rájuk jellemző és általuk ismert, hosszabb (16, 32 vagy 
64 bites) sorozat és annak ellentettje formájában közlik egymással. Úgy 
választják meg ezeket a sorozatokat, hogy azok a többi felhasználó sorozatával 
összeszorozva nullát adjanak, míg a sajátjukkal 1-et (illetve az ellentett sorozat 
esetén —1-et). Ez a csatornafelosztás a közvetlen sorozatú kódosztásos 
többszörös hozzáférés, vagy angol rövidítéssel a DSSSMA (Direct Seguen- 
ce Spread Spectrum Multiple Access). Kódosztásnak azért hívják, mert az 
egyes felhasználók kódjaik — a csak rá jellemző sorozataik — segítségével 
úgy osztják fel egymás között a csatornát, hogy azt frekvenciában és idő- 
ben korlátozatlanul igénybe vehetik. Elképzelhető a kiosztott kód másféle 
felhasználása is. A következő két bekezdés ezeket a lehetőségeket foglalja 
össze. 

Igen elterjedt a frekvenciaugratásos spektrumszórás (FH — Freguency 
Hopping) is. Ezesetben a csatorna több rész-frekvenciasávra van bontva, 
és az adó az előre elküldött sorozat elemeinek megfelelően 7" időnként 
másik alsávban ad. Ha például az adó és a vevő a 241528 . . . sorozatot 
kapta, hogy az adás kezdetétől számított 7" ideig a második frekvenciasáv- 
ban kell adnia, illetve vennie, 7-től 27-ig a negyedikben, és így tovább. 
A jó kódoknál ritkán fordul az elő, hogy két felhasználó is ad egy frek- 
venciasávban, azaz hogy ütközés következik be. Attól függően nevezik a 
rendszert lassú vagy gyors frekvenciaugratásúnak, hogy a T idő hosszabb-e 
annál, ameddig egy bitnyi információ áthalad a csatornán vagy rövidebb. 
Lassú frekvenciaugratást használ például a GSM. 

Az előre kiosztott kódok felhasználásának harmadik módja az, ha a 
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frekvenciaugratásnál felvázolt eljárást az időintervallum további osztásával 
kapott idősávok közötti ugratásra használják. 

Nagy előnye a kódosztásos nyalábolásnak (CDMA - Code Division Mul- 
tiple Access), hogy a rendelkezésre álló részsávoknál nagyobb számú fel- 
használót képes kezelni (persze nem akar például mindenki egyszerre 
telefonálni, így sok a passzív tag). Nem szükséges minden egyes beren- 
dezést egy központhoz szinkronizálni, ami megkönnyíti a kezelhetőséget. 
Minden felhasználó tetszőleges időpontban kezdhet el kommunikálni. 

Ahhoz, hogy ezt lehetővé tegyék, a kiosztott kódoknak - akár közvetlen 
sorozatú, akár ugratásos CDMA-ról beszélünk - igen speciálisaknak kell 
lenniük. 


e Ahhoz, hogy a sok felhasználót kezelni tudják, a különböző felhaszná- 
lóknak kiosztott sorozatoknak nagyon különbözőeknek kell lenniük, 
hogy a csatornában való ütközések számát minimalizálják. Mivel 
többnyire nem egyidőben kezdik el használni a csatornát a különböző 
adó-vevő párosok, szükséges az is, hogy a kódok időbeli eltoltja kellő- 
en eltérő legyen. Két, időben egymáshoz képest tetszőlegesen eltolt 
függvény, illetve sorozat hasonlóságát keresztkorrelációval mérik. A 
jó kódoknak tehát kicsi a keresztkorrelációjuk. 


Ahhoz, hogy a központi szinkronizáció elkerülhető legyen az egyes 
kódoknak és az időben eltoltjuknak is kellő mértékben különbözniük 
kell. Egy függvény vagy sorozat önmagának időbeli eltoltjához való 
hasonlóságát a függvény, illetve sorozat autokorrelációja jellemzi. A 
jó kódoknak tehát az autokorrelációja is kicsi. 


6.3. A döntésről 


Az információátviteli csatornák többnyire bizonyos mértékben torzítják 
a rajtuk áthaladó jeleket. Ezt a torzítást úgy szokták modellezni, hogy a 
bemeneti jelhez valamiféle zajt adnak hozzá, s így kapják meg a csatorna 
kimenetén a vett jelet. 

Ha visszagondolunk a digitális modulációk demodulátoraira, azok 
képesek voltak a vett jelet megfelelőképpen szakaszokra bontani, s a sza- 
kaszokról eldönteni, hogy azok milyen szimbólumhoz tartozó jelalakok 
lehettek a csatorna bemenetén. Hogy a rendszerbe ne vigyünk be újabb 
bizonytalanságot, egy bizonyos vett jelalakhoz mindig ugyanazt a szimbó- 
lumot kell választani. 

Tegyük fel, hogy a csatorna bemenetén a C; € C elemek fordulhatnak 
elő, a kimenetén pedig az X halmaz elemei. Ha a megfigyelt X; jelalakból 
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szeretnénk arra következtetni, mik voltak a megfelelő C;-k, a folyamatot 
le tudjuk írni egy g : X AR C függvénnyel. A 9(X) függvényt döntésnek 
nevezzük. (Ha a g értékkészlete, azaz a C halmaz nem véges sok elemből 
áll, akkor a függvényt nem döntésnek, hanem becslésnek hívjuk.) Az adott 
A döntés során aztán arra törekednek, hogy e költségfüggvény várható 
értéke minimális legyen. A következő két szakasz két különböző lehet- 
séges költségfüggvényről - az a posteriori valószínűségeknek, illetve a 
likelihoodnak a reciprokáról — fog szólni. 

Az az esemény, ha a C; mellett döntünk, az í-edik hipotézis. Az X halmaz 
azon DÖ részhalmaza, amelynek vétele esetén mindig az i-edik hipotézist 
tesszük (azaz mindig a C; elem mellett döntünk), a g függvény i-edik dön- 
tési tartománya. Ha ismerjük a g döntés összes döntési tartományát, azzal 
tulajdonképpen megadjuk az egész g függvényt. Ha tudjuk, hogy az adott 
C; elemek p(C;) valószínűséggel fordulnak elő, a p(C1), p(C2), . . . pP(Cm) 
valószínűségeket a priori valószínűségeknek nevezzük. A p(C;].X5) valószí- 
nűségekre pedig, mint a posteriori valószínűségekre szoktak hivatkozni. 


6.3.1. Bayes-döntés 


Válasszuk meg úgy az i-edik döntési tartományt, hogy minden z € D-re 
p(C:]lx) S p(Cslr) legyen, minden j-re, ha i - j. Ez azt jelenti, hogy D9 -be 
csak olyan elemeket válogattunk, amelyeknek a vétele esetén az i-edik 
C-beli elem adása volt a legvalószínűbb. (Ha esetleg több , legvalószínűbb" 
C; is van, akkor valahogy választunk közülük, például a legkisebb indexűt. 
Nem engedünk meg átfedést a döntési tartományok között.) A 


g8(x) — C; har E D) (6.1) 


döntést Bayes-döntésnek, vagy maximum a posteriori döntésnek nevezzük. 
A Bayes-döntés optimális, neki a legkisebb a hibavalószínűsége, de csak 
akkor alkalmazható, hogy ha ismerjük az a posteriori valószínűségeket. 
Ha valamilyen okból azok ismeretlenek, akkor más döntési stratégiát kell 
bevezetnünk. (Az a ritkább, ha ismertek az a posteriori valószínűségek.) 


6.3.2. Maximum likelihood döntés 


Egy a Bayes-döntés helyett alkalmazható megoldás a maximum likelihood 
döntés. Elképzelhető, hogy a p(C;I1.X;) valószínűségeket ugyan nem ismer- 
jük, de azt tudjuk, hogy ha C; volt a csatorna bemenetén, akkor milyen 
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valószínűséggel lesz a kimeneten X;, azaz, mik a p( X;IC;) valószínűségek. 
A p(X;IC;) mennyiséget likelihoodnak nevezünk a maximum likelihood dön- 
tés során pedig a D z döntési tartományokba azon z € X-ek tartoznak, 
melyekre a p(x]C;) maximális. Ez formulákkal a következőképpen írható 


le: 


g8(x) — C; har E DÍ 
TE DN , ha p(x]C;) — max p (TICk). (6.2) 


Ha az a posteriori valószínűségek egyenlők, akkor a maximum likelihood 
döntés megegyezik a Bayes-döntéssel. 

Fontos látni a két döntési folyamat közötti különbséget. A Bayes- 
döntésnél például egy X; szimbólum vétele esetén amellett a leadott szim- 
bólum mellett döntünk, amelynek a legnagyobb a valószínűsége, feltéve, 
hogy a megadott szimbólumot vettük. A maximum likelihood döntésnél 
viszont az összes leadható jel közül amellett a szimbólum mellett döntünk, 
amelynek az adása esetén a legnagyobb a valószínűsége annak, hogy az 
X;-t vesszük. 

Például egy csatornát általában a p(XIC;) feltételes valószínűséggel 
szoktak megadni, így a maximum likelihood döntés meghozása igen egy- 
szerű. Ahhoz viszont, hogy Bayes-döntést tudjunk hozni, ismerni kell a 
bemeneti és a kimeneti szimbólumok előfordulási statisztikáját, hiszen ha 
felhasználjuk p(.X;IC;) és p(C;].X; ) (2.2) definíciós összefüggéseit, 


p(XIIC;) : P(C) 
p(X;) 


Ez azt jelenti, hogy nem csak a csatornáról, hanem a forrásról: a csatorna 
használatáról is adatokkal kell rendelkeznünk, és ez nem túl gyakori eset. 





p(C:I.Xj) — 
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7. Csatornakódolás 


A Shannon-féle hírközlési modell szerint csatorna minden olyan közeg 
vagy eszköz, amely képes arra, hogy információt szállítson két különböző 
térbeli és időbeli pont: a forrás és a nyelő között. A csatornán való áthala- 
dás során azonban az üzenet módosulhat, átalakulhatnak bizonyos jelek 
másokká, vagy akár törlődhetnek is. Az ilyen csatornák a zajos csatornák. 
Zajmentes csatornák csak igen ritkán fordulnak elő, ilyenek például (egy 
ideig) a nyomtatott könyvek, ha nem károsodnak - nem áznak, szakadnak 
el, vagy égnek meg, nem esnek bele egy nagy adag festékbe. Az elektro- 
nikus csatornák többnyire zajosak, legyen szó akár a levegőről, s a benne 
terjedő elektromágneses hullámokról, akár egy koax kábelről, akár pedig a 
számítógép merevlemezéről. A csatorna zajosságának elfogadott mértéke 
a jel-zaj arány, avagy az SNR (signal to noise ratio), amelyet a következő- 
képpen szoktak definiálni: Legyen a jel átlagos teljesítménye S, a zajé N, 
ekkor 


19 
SNR — 101g (G) ; 
A mértékegység decibel. 


"A decibelt általában az erősítés jellemzésére szokták alkalmazni, az 
erősítési arány tízes alapú logaritmusát — pontosabban annak tízszeresét 
- lehet decibelben mérni. A hangerő esetében a jellemezni kívánt hang 
intenzitásának egy adott, egyezményben fixált hangintenzitáshoz (20 
mPa hangnyomáshoz) viszonyított arányát fejezik ki decibelben. 


Fel fogjuk tenni a következőkben, hogy a csatornánk diszkrét jeleket 
visz át, továbbá nem nyel el és nem bocsát ki új jeleket: egy bemeneti 
szimbólum hatására egy szimbólum jelenik meg a kimeneten; persze nem 
feltétlenül mindig ugyanaz a szimbólum. Az ilyen csatornákat szinkron 
csatornáknak nevezik. 


7.1. A csatorna jellemzése, csatornamátrix 


Egy csatornát úgy tudunk megadni, ha megadjuk a C — (ci, ca, . . . Cr) 
bemeneti és a X — (T1,72, . . . s) kimenti jelkészletét, valamint a p(z;lc;) 
feltételes valószínűséget, azaz minden bemeneti jelre megadjuk, milyen 
lehetséges kimeneti jeleket vonhat maga után, s mekkora valószínűséggel. 

Akkor memóriamentes a diszkrét csatornánk, ha a csatorna kime- 
netén megjelenő jelek mindig csak az aktuális bementtől függenek, 
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azaz az egymást követő szimbólumoknak a csatornán való áthaladá- 
sa független esemény. Adjunk le a csatornánkon egymás után n da- 


rab szimbólumot, CD cl2, . . . X-et, ez eredményezze a kimeneten az 
0) 20... r( jelsorozatot. Ennek az eseménynek a valószínűsége 
p(z 30, . . . zel c), . . . cl). A memóriamentesség követelménye 


megfogalmazható, mint 
p(z 3... ze e. . . el) — I[2(zle€). (7.1) 
i—1 


A p(xjlc;) valószínűségeket mátrixba szokták rendezni a következőkép- 
pen 


p(xilci) p(zelci) ... p(xslci) 
fé meet mKe Hi 515018 . 7.2 
p(xile)  pízeler) ... pzs) 


Szokás ezenkívül a csatornát bal oldalon a bemeneti jelekkel, jobb oldalon a 
kimeneti jelekkel, közöttük pedig nyilakkal ábrázolni. A nyilakon fel lehet 
tüntetni a megfelelő feltételes valószínűségeket: 





T1 
C1 

12 
C2 

13 


Az ilyen ábrázolás a csatorna gráfja. 

Egy csatorna zajmentes, ha a mátrixának minden oszlopában pontosan 
egy nem nulla elem van. Ez azt jelenti, hogy egy kimenet mindig csak 
egy bizonyos bemenetből állhat elő. Nem következik belőle viszont az, 
hogy egy bemeneti jel csak egy kimenetet generálhat. Például mindkét 
következő csatorna zajmentes: 
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CI T1 T1 
Hál ? 
C2 12 12 
C2 
ez Tvt 13 13 


Determinisztikusnak nevezzük azokat a csatornákat, amelyekre egy adott 
bemeneti jel mindig ugyanazt a kimenetet eredményezi, azaz a csatorna- 
mátrixának egy sorában csak egy nem nulla elem van, és ez az elem 1. 
Az előző ábra első csatornája determinisztikus és zajmentes is, míg az itt 
következő csatorna csak determinisztikus: 

C1 T1 
C2 


C3 12 
C4 
C5 13 


Példaképpen álljon itt néhány, gyakorlati szempontból is jelentős bináris 
csatorna. A bináris szimmetrikus csatornának (BSC - Binary Symmetric 
Channel) mind a bemeneti, mind pedig a kimeneti szimbólumkészlete 0-ból 
és 1-ből áll, és mind a 0, mind pedig az 1 bemenet esetén p valószínűséggel 
lesz rossz a kimenet. A csatornamátrix és a csatornagráf a következő: 


1—p 
0 0 
Te 
p p ú ú 
1—p 


A bináris Z-csatorna annyiban különbözik a BSC-től, hogy csak az 1-es 
bit esetén hibázik, a 0-t minden esetben 0-ba viszi át. Csatornamátrix és 
-gráf az alábbi: 


1 
1 0 0 fi 0 
p 1-p 
1 1 
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A bináris törléses csatorna bemeneti szimbólumkészlete is 0-ból és 1-ből 
áll, de a kimeneten a 0-n és 1-en kívül egy hibaszimbólumot is tartalmaz. 
Mind a 0, mind pedig az 1 bemeneti jel esetén p valószínűséggel a hiba- 
szimbólumot tudjuk venni. A csatornamátrixa és a gráfja így néz ki: 





0 
1-—-p p 0 
hiba 
0 p 1-p 
1 


7.2. A csatorna vesztesége és az átvitt információ 


A csatornán folyó információátvitel során a C; forráselemek p(C;) — pi; 
előfordulási valószínűsége azt írja le, hogy hogyan használjuk a csatornát, 
a p( X;IC:) valószínűségek pedig a csatornát magát jellemzik. Hasonlókép- 
pen, az entrópia a H(C) — — 2-1 pi 1og2 p; alakjában a csatorna forrását 
írja le, míg a H(XIC) —— 95-12 -1 P(X; " C:) log2 p( X;IC;) feltételes ent- 
rópia a csatornát. 

A csatorna kimenetén csak az Xj € X szimbólumokat lehet megfigyelni. 
Miután megfigyeltük a kimenetet, marad még bizonytalanság arra nézve, 
hogy a bemeneti oldalon milyen szimbólum szerepelt, azaz a közlés során 
információt veszítettünk. Ennek a bizonytalanságnak a várható értéke 


H(CIX;) — 3  p(CIX5) loga p(CIX) 
1 


A csatorna vesztesége ennek az elvesztett információnak a várható értéke, 
a 


H(CIX) — XX; H(CIX;) 23 la X) log2 p(C;IX;) 


j-17—-—1 


entrópia. Magától értetődik, hogy a veszteség nem lehet nagyobb, mint a 
teljes csatornára adott információ várható értéke, a forrás H(C) entrópiája. 
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Zajmentes csatorna vesztesége 0, mivel p(C;].X5) vagy 1, vagy pedig 0, 
attól függően, hogy összetartoznak-e a C; és X; szimbólumok vagy nem. 
Ennek következtében vagy a log; p vagy pedig p és a teljes p log; p lesz 0 az 
összeg minden tagjában. 

Teljesen zajos csatorna vesztesége a teljes H(C), hiszen ekkor a lea- 
dott és a vett jelek egymástól függetlenek, így p(C; : XI) — p( C)p(.X;) és 


p(C:]X) — E — p(C;). Ennek következményeként 


H(CIX) — - (re ogre ) log p(C;) — 1 - H(OC). 


Az átvitt információ a csatornára adott információ várhatóértékének 
és a veszteségnek a különbsége, azaz a 


H(C) — H(CIX)—K(C.X) (7.3) 


kölcsönös információ. A csatornát jól le lehet írni a fenti kölcsönös infor- 
mációval, ez adja ugyanis meg azt az átlagos információt, amelyet egy X; 
vételekor nyerünk az őt előidéző C5-ről. Az átvitt információ felírható a 
feltételes és együttes valószínűségek felhasználásával a következőképpen: 





K(C.-x) — - yoo; ) log2 p(C;) -- 
MSZH X)loga p(C;I.X) — 
7 opot : Xj) log2 p(C;) —- 
HEXnG X) log, p(C;IX), (7.4) 


mivel p(C;) — 2; p(C; " XI). Ha kiemeljük páronként a p(C; : X;) felté- 
teles valószínűtségéketé és átírjuik a logaritmusok különbségét a hányados 
logaritmusára, a 


IK((C.X) — Szöv égtőjk . XI) loga Tell 
lgj-i 
Pp(C; : X) 
S fö X) log ——— HCDBOA) (7.5) 


1-1 j—-1 
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kifejezést kapjuk. 
A csatorna kapacitása a rajta maximálisan átvihető információ, a 


C — max I(C-Xx) (7.6) 
Felhasználva a (7.5) egyenletet, 


p(C; : XI) 
C — max p393tl (C; : X) log2 Tó) ; (7.7) 


. Shannon eredetileg a következő határértéket nevezte csatornakapacitás- 
nak: log N(T) 
B 08 
ze Ti 

ahol N(7) az olyan T ideig tartó jeleknek a száma, amelyek létrejöhet- 
nek. A két definíció lényegében ekvivalens, ami belátható úgy, hogy 
vesszük a C1,0?, . . . Cr szimbólumokból - a csatorna bemeneti szimbó- 
lumkészletéből - alkotott olyan üzeneteket, amelyek T ideig tartanak, 
megszámoljuk őket, és vizsgáljuk a darabszámuknak 7 — co viselke- 
dését. Tudni kell azt, hogy az egyes szimbólumnak a csatornán való 
áthaladása rendre 71,172, . . . ,T. ideig tart. 


7.3. Csatornakódok jellemzése 


A csatornakódolási eljárások célja az, hogy az információátvitel hibáját mi- 
nimálisra csökkentsük, illetve, hogy a zajos csatorna által okozott hibákat 
korrigálni tudjuk. A Shannon-féle csatornakódolási tétel óta tudták, hogy 
lehetséges zajos csatornán is nagy biztonsággal, hatékonyan üzenetet továb- 
bítani. Mivel azonban a tétel nem konstruktív — azaz nem ad meg konkrét 
módszert arra, hogyan kódoljuk az üzenetet -, egy jó ideig nem tudták 
kihasználni a hírközlési csatornáknak a tétel által leírt korlátait. Eleinte 
nem is volt szükség a hibajavító kódok polgári alkalmazására, legfeljebb 
egy-egy berendezés irányítási rendszerében. Az első felhasználók a katonai 
hírközlő rendszerek voltak, és az eredmények nem mindig jutottak nyilvá- 
nosságra. A mikroprocesszorok és a személyi számítógépek kifejlesztése 
azonban maga után vonta a hibajavító kódolások alkalmazásának széles 
körű elterjedését. 


Legyen a csatorna bemeneti ábécéje C — (C1,C2, . . . C,) a kimeneti 
ábécéje X — (X1,X2, . . . Xs). A csatorna bemenetére adjunk egy n hosszú- 


ságú c — (CD c, . . . cl) kódszót. Minden cŐ) e C. A kimeneten ekkor 
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egy szintén n elemű jelsorozat fog megjelenni, x — (xx, ... ax), 


x() e X. Ekkor el kell dönteni minden egyes x(?) szimbólumról, hogy 
miből származik, azaz hogy a bemeneti ábécé melyik C; elemét adhatták az 
1-edik helyen. Ezt valamilyen g : X £R C döntési algoritmussal eldöntjük, s 
így kapunk egy v — (0) w0), . . . v) szimbólumsorozatot. Minden i-re 
v() e C bemeneti ábécének, de nem feltétlenül igaz, hogy v(?) — cl). Az 
n hosszúságú, C-beli elemekből felépülő szimbólumsorozatok halmazát 
jelöljük C"-nel, így c e C" és v € C". 


Matematikai kitérő - Vektorterekről. A C" halmaz tulajdonképpen a 
szó matematikai értelmében vett vektortér, így logikus az elemeit a 
vektorokra jellemző vastag kisbetűkkel jelölni. A vektortér matema- 
tikai definíciója a következő: Vegyünk egy V halmazt, értelmezzünk 
az elemein egy műveletet, a számmal való szorzást, és az elemek között 
egy másik műveletet, az összeadást. A v € V vektor A számmal való 
szorzását A : v-vel jelölhetjük, egy másik, w € V vektorral vett összegét 
pedig v 3 w-vel. Alapvető, hogy sem a számmal való szorzás, sem 
pedig két vektor összeadása ne vezessen ki a V térből, azaz A-v € V és 
vTtw € V. Ezenkívül a számmal való szorzás rendelkezik a következő 
tulajdonságokkal: 


1.1-v—-v 
2. A : (K: v) — Ax : (v) (asszociativitás, azaz csoportosíthatóság) 


3. (A--k):"v — A-v-bx-v (disztributivitás, azaz kb. szétterjeszthetőség) 
A vektorok összeadása pedig az alábbi feltételeket teljesíti: 


1. v 1 w — w -- v (kommutativitás, azaz felcserélhetőség) 
2. vF(w 4 u) — (v 4 w) -- u (asszociativitás) 


3. létezik olyan 0 nullelem, amelyre minden v € V vektorra v -- 0 — 
v 


4. minden v € V-nek létezik ellentettje, —v € V, mellyel v 3-(—v) — 
0 


A vektortereket szokás lineáris tereknek is nevezni. Vektortér például 
a két vagy háromdimenziós (euklideszi) tér vektoraiból (irányított 
szakaszaiból) álló tér, de a fogalom ennél sokkal általánosabb. A 
legfeljebb n-edfokú polinomok tere is vektortér. 
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Ahhoz, hogy a vektorokat le tudjuk írni, be kell vezetni néhány fogal- 
mat. Lineárisan függetlenek a v1,va, . . . vw vektorok, ha a 


A1:V1FA2:Vv2Ft...FAwN: vwx-0 (7.8) 


egyenlőség akkor és csak akkor teljesül, ha minden 7-re A; — 0. Ha van 
olyan N darab A; szám, amelyek közül néhány nem nulla, és teljesítik 
a (7.8) egyenletet, akkor a vektoraink összefüggők. A v1i,v2, . . . ,VN 
összeget értjük. 

Egy V vektortér N-dimenziós, ha található N darab független vektora, 
azonban N -- 1 darab független vektora már nincs. Ekkor a vektor- 
tér minden egyes eleme kifejezhető, mint az iménti N elem lineáris 
kombinációja. Az N dimenziós vektortér N független vektora tehát 
teljesen meghatározza a teret, ezért az ilyen vektorokat alapvektornak, 
vagy bázisvektornak nevezzük, a bázisvektorok összességét pedig 
bázisrendszernek, vagy egyszerűen bázisnak. Ekkor tehát minden v 
felírható, mint ai : e1 -- a2 : ez - . . . 4 an : ex, ha e;-k a bázisvektorok. 
Ha e;-k adottak, akkor ez a felírás (sorrendtől eltekintve) egyértelmű, 
azaz csak egy (a1,02, . . . an) szám-N-esre igaz, hogy v — basa A; " ez. 
Ha megállapodtunk a bázisvektorok mibenlétében (például az ryz 
Descartes-koordinátarendszer három tengelye irányába mutató egy- 
ségvektorok), akkor a vektorokat elég az a; kifejtési együtthatóikkal 
jellemezni. Ezt a jelölést alkalmazva v — (a1,02, . . . xx ) egy sorvektor, 
ami a koordinátageometriában tanult (az ay, az ) jelölés általánosítása. 
Szokás még a következő, oszlopvektoros jelölést alkalmazni: 


Egy tér bázisa nem egyértelmű. Gondoljunk csak arra, hogy ha a koor- 
dinátarendszert elforgatjuk, akkor az új 1", y! és 2" tengelyek irányba 
mutató e, e, ez egységvektorok egymástól függetlenek maradnak. 
Így alkalmasak lesznek bázisnak, csak a vektorok (a aa) alakja 
lesz más. 
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7.1. példa: Adjunk meg egy bázist a már említett, legfeljebb n-edfokú poli- 
nomok terében. 


Megoldás: Bázisnak kiválóan alkalmas az (29 1 , . . . x") rendszer, hiszen 
minden (legfeljebb) n-edfokú polinom felírható ezen függvények lineáris 
kombinációjaként, azaz ax: 394 a4:rt Ah ...Fan:rN — JE a " 1 alakban. 


Egy V vektortér alterének nevezzük az olyan W részhalmazát, amely 
szintén vektortér, azaz a számmal való szorzás és a vektorok összea- 
dása nem vezet ki belőle. Altér például a háromdimenziós terünkben 
a kétdimenziós sík, vagy a legfeljebb n-edfokú polinomok terében a 
legfeljebb k-adfokú polinomok tere, ha k c n. 


7.3.1. Kódtávolság és a javítható hibák száma 


Két C"-beli elem, c és v Hamming-távolsága azon i pozíciók száma, ahol a 
csatorna hibázott, azaz ahol c(?) -£ v(). A Hamming-távolság jele d(c,v). A 
Hamming-távolság teljesíti a matematikai távolságfogalom követelményeit, 
azaz 


dícw) 2 0 
d(c,v) — d(v,c) 
d(c,v) ca d(c,w) 4 d(w,v) 


Az utolsó egyenlőtlenség a háromszög-egyenlőtlenség. 

A csatorna torzítja a rajta áthaladó jeleket, így a kimeneti oldalon az 
üzenetbe hibákat visz bele. Egyszerű hibázásnak nevezzük azt, ha a hibák 
helye és értéke nem ismert, csak maga a vett v szimbólumsorozat. Ha 
tudjuk, hogy melyik pozíció(k)ban lehet hiba, törléses hibáról beszélünk. 

A C" halmaznak a K — (co,c1, . . . cm-—1) részhalmazát kódnak ne- 
vezzük, a K-beli elemeket kódszavaknak. Ha a már tömörített B-beli 
elemekből álló üzenet / hosszúságú szakaszainak egy-egy K-beli kódszót 
feleltetünk meg, akkor az üzeneten végrehajtott 


F:BeEK (7.9) 


egy-egyértelmű leképezés a csatornakódolás. 

A dekódolás során két műveletet hajtunk végre: Először a vett C"-beli v 
vektorokról el kell dönteni, hogy milyen K-beli kódszavakból keletkezhet- 
tek, majd alkalmazni kell az F inverzét. Ez formulákkal a következőképpen 
néz ki: 

G:C"oK, és F"!:KöeB.. (7.10) 
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Itt az F7! lépés az F ismeretében triviális. A G függvény végzi a tulaj- 
donképpeni dekódolást. A G függvény lehet táblázatban megadott, vagy 
például választhatjuk azt a c" kódszót, amelynek a legkisebb a vett v-től 
való Hamming-távolsága, azaz amelyre d(c" ,v) minimális. (Nem szokták 
azonban minden lépés során kiszámítani a vett v-nek minden K-beli elem- 
től vett a távolságát, inkább itt is táblázatban kezelik minden lehetséges 
v € C"-hez a hozzárendelendő kódszót.) BSC-re ez a dekódolás optimális. 
Egy kódolás fontos paramétere a kódtávolság, amelyet a 
: VA 

dmin — szál e si d(cc ) (7.11) 
formulával definiálhatunk. A kódtávolság lényegében a kódszavak közötti 
minimális távolság. 

Ha a vevő oldalon csak azt szeretnénk jelezni, hogy a vett sorozat 
hibás - például azért, hogy újra elküldessük a kódszót -, akkor hibajelzésről 
beszélünk. Csak akkor tudjuk jelezni, hogy a kódszavunkban hiba van, ha 
nem egy másik érvényes kódszóba transzformálódott, azaz, ha v £ K. Ez 
akkor lehetséges, ha a keletkezett v és az eredeti c távolsága kisebb, mint a 
kódtávolság, d(c,v) 2 dmin. 

Ha v-vel jelöljük az adott kódszóban elforduló hibás szimbólumok számát, 
akkor egy dmin kódtávolságú kódolással v a dmin hibát tudunk jelezni. 

Mivel a hiba jelzése után a kódszót újból el szokták küldeni, és ez 
igen sok időt vesz igénybe, általában olyan csatornakódolási eljárásokat 
alkalmaznak, amelyek lehetővé teszik a hiba kijavítását. Tegyük fel, hogy 
c-ből a csatornán való áthaladás során v vektor keletkezik, mégpedig v 
darab egyszerű hibával. Ekkor csak úgy lehet visszaállítani az eredeti c 
kódszót, ha a v-nek minden más lehetséges c! c C kódszótól való távolsága 
nagyobb, mint d(c,v). Írjuk fel aháromszög-egyenlőtlenséget a kódszavak 
távolságára: 


d(c" c) £ d(c,v) 4 d(v,c") — d(c,v) 4 d(c,v) 


Ha ezt a formulát átrendezzük úgy, hogy az egyik oldalon csak d(c",v) 
maradjon, majd behelyettesítjük a hibák javíthatóságának 


d(cv) 5 d(e,v) (7.12) 
feltételébe, akkor azt kapjuk, hogy 


d(c,c") — d(c,v) 5 d(e,v). 
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Újabb átrendezéssel ebből a 
d(c,c) 5 2d(e,v) 


feltételt kapjuk, minden c!" c C-re. A c"-k egyike sem nagyobb, mint dmin, 
így ú 
d(c,v) 2 3 Amin; (7.13) 


tehát 

ha egyszerű hibázásról van szó, egy dmin kódtávolságú kóddal legfeljebb 
(dmin — 1) /2 hibát tudunk kijavítani. 

(Ha dmin páros, akkor a javítható hibák száma (dmin — 2) /2.) 

Törléses hibák esetében tudjuk, hogy melyik pozíciókban van a hiba. 
Ekkor dmin azt a számot takarja, amennyi szimbólumnak a megfelelő po- 
zíciókról való törlésével a két legközelebbi kódszó maradéka azonos lesz. 
Ha ennél kevesebb törléses hibát generál a csatorna, akkor azok javíthatók 
lesznek. 

Törléses hibák esetén tehát maximálisan dmin — 1 hiba javítható. 

Látható, hogy minél nagyobb a kódtávolság, annál több hibát tudunk 

javítani, illetve jelezni. 


A Singleton-korlát összefüggést ad egy kód ábécéjének r elemszáma, a 
kódszavak n hossza és M száma, valamint a kódtávolság között, mégpedig 
az 

M 2 r"edmint1 (7.14) 


egyenlőtlenséggel. 

Bizonyítás: Az r elemből felépülő, k hosszúságú különböző sorozatok száma 
r; (I. ismétléses variáció). Legyen k egy olyan természetes szám, amelyre 
rR-1 s M £ rt. Mivel több a kódszavak M száma, mint ahány különböző 
k — 1 hosszúságú sorozatot tudunk a kódábécé r eleméből felépíteni, biztos, 
hogy van legalább két olyan kódszó, c1 és c2, amelyeknek az első k — 1 
pozíciójában azonos elemek vannak, azaz amelyeknek a távolsága kisebb, 
mint n — (k — 1). Így a kódtávolság 


dmin £n—k41 (7.15) 


Ha átrendezzük az egyenlőtlenséget k-ra, majd minkét oldalt az r kitevőjébe 
emeljük, és figyelembe vesszük, hogy M £ r", a tételt bebizonyítottuk. 
(O.E.D) 
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A kódszavak M száma egyértelműen meghatározza k-t, így a Singleton- 
korlát lényegében egy az M-től függő felső korlátja a kódtávolságnak, 
amely a (7.15) alakot ölti. Egy kódot maximális távolságúnak, vagy MDS- 
nek hívunk (maximum distance separable), ha a (7.14) formulában az 
egyenlőség érvényes, azaz 


dmn—n—k31-—n—7log, M 7-1. 


Az M-nek az r alapú logaritmusa ugyan nem mindig egész szám, de 
mindig találhatunk az M-hez egy k természetes számot, amelyre rf-! c 
M A rk igaz. Az n és a k számokat szokták a kód paramétereinek nevezni. 


A Hamming-korlát vagy gömbpakolási korlát megadja annak a feltéte- 
lét, hogy egy (n.k) paraméterű kóddal v egyszerű hibát ki lehessen javítani. 
Szemléletesen, a C" térben - az n hosszúságú szimbólumsorozatok terében 
- a c € K kódszavak pontok, méghozzá lehetőleg egymástól minél távolabb 
elhelyezkedő pontok. A javítás alapötlete az, hogy ha a v vektor egy adott 
c kódszó körüli v sugarú gömbben var, azt a c-be javítjuk. Természetesen a 
gömbök nem fedhetnek át, különben nem tudnánk, melyik kódszóba javít- 
sunk. Ha r elemű a kódábécé, akkor az olyan vektorok száma, amelyek a 
c-től pontosan zi elemben térnek el (méghozzá meghatározott pozíciókban), 


(r— 1). 


Azt, hogy melyek legyenek azok a pozíciók, amelyen eltérés mutatkozik az 
n hosszú kódszótól, 


() -féleképpen 
(4 


választhatjuk ki, így azon vektorok száma, amelyek pontosan i elemben 


különböznek c-től 
( (r— Li. (7.16) 


Hogy megkapjuk a v sugarú gömbön belüli vektorok számát, összegezni 
kell a (7.16) tagokat iz — 1,...,v-re. Az összes gömbben elhelyezkedő 
vektorok száma nem haladhatja meg a C" tér elemeinek a számát, r"-t, így 
ha a kódszavak száma r" , akkor 


103 ú (pe íly? 257. (7.17) 


Az olyan kódokat, amelyekre a (7.17) Hamming-korlátban az egyenlő- 
ség igaz, perfekt kódoknak nevezzük. 
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7.4. Csatornakódolási tétel és megfordítása — a Shannon- 
Hartley-tétel 


Az információátvitel gyorsaságának jellemzésére bevezethetjük a jelsebes- 

séget vagy más néven kódsebességet a következő formula segítségével: 

H(K) 
s. 


R — (7.18) 


Jelen esetben a H(K) a kódolt forrás entrópiája, az n pedig továbbra is a 
kódszavak hossza. A jelsebesség tehát az egy kódszóval átlagosan átvitt 
információ és a kódszó hosszának a hányadosa. Ha nem ismerjük a kódsza- 
vak előfordulási valószínűségét, általában egyenletes eloszlással szoktuk 
közelíteni, azaz p(c;) — 1/M minden i-re, ha M a kódszavak száma. Ekkor 
az entrópia a — D5, ar 1082 ay — log2 M alakot ölti, a kódsebesség pedig 


. log M 
on 





R (7.19) 


lesz. Ez a kódsebesség tulajdonképpen egy a csatornakódnak csak a leg- 
általánosabb paramétereitől (kódszóhossz és kódszószám) függő, a többi 
specifikációjától független átlagos kódsebességnek is felfogható. 


A Shannon-Hatrtley-tétel vagy csatornakódolási tétel arra ad választ, 
hogy az adott C csatornakapacitású csatornán milyen sebességgel lehet 
megfelelő biztonsággal, hibamentesen információt továbbítani. A tételt a 
következőképpen lehet összefoglalni: Egy C kapacitású, diszkrét, memó- 
riamentes csatornán, ha a kódsebesség kisebb, mint a csatornakapacitás, 
akkor lehet olyan n hosszúságú kódszavakból álló csatornakódot talál- 
ni, amelynél a hibás dekódolás valószínűsége tetszőlegesen kicsi. Ha a 
csatornakapacitásnál nagyobb jelsebességgel szeretnénk a csatornán infor- 
mációt továbbítani, a hibás dekódolás valószínűsége nem csökkenthető 
tetszőlegesen kicsivé, még az n kódszóhossz növelésével sem. Matematikai 
formulákkal: 


e Ha R c C, akkor lehet olyan n kódszóhosszt találni, hogy a hibás 
dekódolás valószínűsége bármilyen kis c 5 0 számnál kisebb legyen. 


e Ha R - C, akkor a hibás dekódolás valószínűsége mindig nagyobb, 
mint 1 — § — 3 5 0. Ez az alsó korlát n növelésével nő. 


A tétel nem konstruktív, azaz nem ad meg módszert az ideális jelsebes- 


ség elérésére, csak azt adja meg, hogy a hibamentes információtovábbítás 
maximális jelsebessége a csatornakapacitásnál mindenképpen kisebb. 
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8. Lineáris blokk-kódok 


Az (n.k) paraméterű lineáris blokk-kódok k elemű tömörített üzenetvekto- 
rokból képeznek n elemű kódszóvektorokat. 


8.1. Generátormátrix 


A lineáris csatornakódok K C C" tere egy vektortér, avagy lineáris tér. 
Létezik tehát a K vektortéren belül egy bázisrendszer, amelynek az elemeit 
g0.g1, . . . 8x—1-gyel jelöljük, ahol k a K tér dimenziószáma. A c; kódszavak 
egyértelműen kifejthetők a gj bázisvektorok szerint: 


k—1 
Cj; — pa aij8j: (8.1) 
j—0 


A c;-t tehát lehet reprezentálni az a; — (ao, , : . . .0i(k—1)) sorvektorral. 
A c; kódszóvektort visszakapjuk, ha a;-t egy olyan mátrixszal szorozzuk 
meg, amelyet a g; bázisvektorok egymás alá írásával kapunk meg: 


80 900 901 ke 90 (n—1) 
G - Él Mi aB HB te 91 ba 
8k—1 9(k—1)0  9(k—1)1 ::: 9(k—1)(n—1) 


A G mátrixot a kód generátormátrixának nevezik. A mátrix k sorból és n 
oszlopból áll. 


Generátor úgy, mint a kódot generáló rendszer, amely az n hosszúságú 
szimbólumsorozatok C" teréből előállítja akódok K alterét. 


Mivel a bázisrendszer választása nem egyértelmű, a generátormátrix 
sem az, minden lehetséges bázisrendszerhez más és más G mátrix tartozik. 
Van azonban egy olyan bázisrendszer, amelyre a kifejtési együtthatókból ké- 
pezett a; vektor pont a kódolandó tömörített (forráskódolt) b; üzenetvektor. 
Az is igaz, hogy ha a (b;li — 0.1, . . . MW — 1) üzenetvektorok mindegyikét 
megszorozzuk egy G generátormátrixszal, akkor jó lineáris blokk-kódot 
fogunk kapni. 


Figyeljük meg, hogy az n dimenziós C" vektorterünk n elemű vektorait 
használjuk a k dimenziós K altér leírására, azaz a kódolásra. A k dimenziós 
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tereket viszont jól le lehet írni k elemű sorvektorokkal, tehát a maradék 
n — k elem nem hordoz lényeges, új információt, azaz redundáns. Ezt a 
redundanciát használjuk arra, hogy megnöveljük a kódszavak Hamming- 
távolságát: arra, hogy még zajos csatorna esetén is nagy biztonsággal 
visszafejthető legyen az üzenetünk. 
A csatornakódolás tehát a lényeges információ mennyiségét nem változtatja, 
csak a felhasznált szimbólumok számát növeli, így az egy szimbólumra 
jutó információ várható értékét, azaz az entrópiát csökkenti. 
Nézzünk egy egyszerű számpéldát. 


8.1. Példa: Vegyünk kétdimenziós bináris vektorokat, mint üzeneteket, a 
2 x 5-ös generátormátrix pedig legyen 


T50 a 0 
GE ( a a 0 ) ; 
Adjuk meg a kódszavakat és a kódtávolságot. 
A generátormátrixból a bázisvektorok 


go — (10101) 
gi — (01110). 


A bo — (0 0) üzenethez tartozó kódszó cg — bog : go 4 bo1 :"g1—0:-(10101)- 
0-(0111 0) — (0 0 0 0 0), ahol bog a bo vektor nulladik, bg1 pedig az első 
komponense. Hasonlóképpen a többi lehetséges üzenetvektorra, bi — (0 1)-re, 
b2 — (1 0)-ra és bs — (1 19-re a kapott kódszóvektorok: 


Ci — b10o:go 4 bi1:g1—0-(10101)41-(011109—(01110) 
C2 —-— b2o : go 4 b21:g1—1:-(10101)340-(011109—(10101) 
C3 —-— b30 :go 4 b31"g1—1:(10101)341-(011109—(11011). 








A kód valóban lineáris, vektorainak összeadására és a O, illetve 1 számmal való 
szorzására érvényesek a vektortér-axiómák. A kapott kód minimális kódtávolsá- 
gának kiszámításához nézzük meg a kódszavak Hamming-távolságát: 


d(co,c1)— 3, d(co,c2) — 3, 
d(co,c3)— 4, d(ci,c2) — 4, 
d(c1,c2) ai 3, d(c2,c3) 7-3. 


Ezek közül a legkisebb a 3, így dmin — 3. 
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8.1.1. Szisztematikus kódok generátormátrixa 


Ha az (n.k) paraméterű kódunk c; € K vektorai olyan szerkezetűek, hogy 
azok végéről az utolsó n — k elemet elhagyva, az eredeti üzenetet kapjuk 
vissza, akkor szisztematikus kódról beszélünk. A szisztematikus kódok 


c; vektorainak első k elemét üüzenetszegmensnek hívják, a maradékot pari- 
tásszegmensnek. 


Az első alkalmazásokkor csak egy egyszerű paritásbitet tettek az üze- 
netek után a hibás üzenetátvitel detektálására, azaz az üzenetek után 
megadták, hogy páros vagy páratlan számú egyest továbbítottak. Innen 
eredeztethető a név. 


A 8.1 példában szereplő kód szisztematikus volt. A szisztematikus 
kódok generátormátrixa jellegzetes, az első k oszlopa egységmátrixot alkot 
— ez adja a mátrixszorzás során az üzenetszegmenst -, a további n — k 
oszlop közül pedig egyik sem áll csupa nullából; ez a k x (n — k)-s mátrix 
a paritásszegmenst hozza létre. 


Matematikai kitérő — Mátrixszorzásról Vegyünk először egy j elemű 


a sorvektort, és egy szintén j elemű b! oszlopvektort. Az a :- bT 
skalárszorzaton a következő számot értjük: 


bi 
b2 
a:bT—( a a2 ... aj ) ; — a1bi1Tt-a2b2-...-ajb;. (8.2) 


bj 


24 


Legyen egy A és egy B mátrixunk, az első álljon ugyanannyi oszlopból 
(j darabból), mint ahány sorból áll a második: 


da11 412 ... d1j b11 b12 5-iézé bik 

ü31 €32 ::: a2j b21 bo2 ásó bok 
Ash 2. Be 

di1 a2  ... dij bji bj2 úg bik 


Az A :- B szorzaton azt az i sorból és k oszlopból álló mátrixot értjük, 
amelynek az m-edik sorának n-edik elemét a következőképpen kapjuk 
meg: 

(A § B) men — amibin t am2ban € ... amjbjn 
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Ez tulajdonképpen az A mátrix m-edik sorvektorának és a B mátrix 
n-edik oszlopvektorának a skalárszorzata. 


Ha i -— k, akkor a B- A szorzás nem értelmezhető, mivel a B mátrix sor- 
vektorai nem ugyanolyan hosszúak, mint az A mátrix oszlopvektorai. 
Ha i — k, akkor lehet értelmezni a B - A szorzatot, de roppant kevés 
kivételtől eltekintve A - B 7 B :- A. A mátrixszorzás tehát többnyire 
nem felcserélhető, nem kommutatív. 


Ha valamelyik négyzetes mátrix 


1 0 ... 0 

0 1 0 
I — 

0 0 ... 1 


szerkezetű, akkor a vele való szorzás — akár jobbról, akár balról — az 
eredeti mátrixot adja, azaz: 


IA- A, — AI—A. 


Az I mátrixokat ezért egységmátrixnak nevezzük. 


H-—-—-—-—- 0 a 


A vektorok skalárszorzatánál mindig sorvektort szorzunk oszlop- 
vektorral, ha fordított sorrendet alkalmaznánk, azaz egy n elemből 
álló oszlopvektort szoroznánk ugyanolyan elemszámú sorvektorral, 
az eredmény egy n x n-es mátrix lenne, amelynek az i-edik sorában 
a j-edik elem az oszlopvektor j-edik és a sorvektor i-edik elemének 
szorzata. A vektorok ilyen szorzását diadikus szorzásnak nevezzük. 


Megfigyelhetjük, hogy a 8.1 példában szereplő generátormátrixának 
az első két oszlopa egységmátrixot alkot, és minden kódszónak az első 
két eleme megegyezik a kódolt üzenettel. Ezt a két elemet hozza létre az 


egységmátrix. 


8.2. A paritásellenőrző mátrix és a szindróma 


Ha a csatorna kimenetén kaptunk egy v € C" vektort, azt valahogy ellen- 
őrizni kell, hogy jó kódszó-e. Az ellenőrzést úgy lehet elvégezni, hogy a 
v vektort egy paritásellenőrzési mátrixszal szorozzuk meg, és vizsgáljuk 
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a kapott s vektort, amelyet szindrómának nevezünk. Jelöljük HF -vel a 
paritásellenőrző mátrixot (vagy röviden paritásmátrixot), amely n sorból 
és n — k oszlopból áll. Akkor és csak akkor érvényes kódszó a v vektor, ha 


s—v:H-— 0. (8.3) 
A c; — a, G kódszavak szindrómája tehát O, azaz 
csH" — a,GHT — 0, (8.4) 


minden --re. 

Ha csak a GH! mátrixszorzásával előállt k x (n — k) elemű mátrixot vizs- 
gáljuk, annak is minden eleme 0 lesz, különben nem teljesülhetne (8.4) 
minden lehetséges a;-re. Így 


GH! — 0. (8.5) 


Ezt az egyenlőséget használják fel H" előállítására G-ből, illetve G előállí- 
tására H" -ből. 


8.2. Példa: Készítsük el a 8.1 példában szereplő generátormátrixhoz tartozó 
paritásellenőrző mátrixot. Számoljuk ki vele a v — (1 0 1 1 1) vektor 
szindrómáját. 

Tudjuk, hogy ha a generátormátrix 2 x 5-ös volt, akkor a kód két paramétere n — 5 
és k — 2, a paritásmátrix mérete pedig n x (n — k) — 5 x 3. Ha felhasználjuk 
azt, hogy a generátor- és paritásmátrixok szorzata nullmátrix (8.5), a következő 
mátrix-egyenletet kell megoldani: 














hia hi2 hi3 
hai h22 h23 
10 101 0 0 0 
GHT — ( ) "1 hz1 hz2 hzz3 [/- ( ) 
0 1110 0 0 0 
hai haz haz 
hsi hsz2 hsz 
Eszerint a HT első oszlopainak az elemeire igaz lesz, hogy 
1-hi1140-ho141-h3140-hs1 41: hs5i I 0 
0 ció h11 fú; Cl 1 ta h21 at 1 kt h31 És Kál 1 ev hai ay Ha 0 jú hs51 - 0. 


Mivel a paritásmátrixnak nem lehet tiszta nulla oszlopa, az első egyenletből követ- 
kezik, hogy a h11, h31, hs1 hármasból pontosan 2 db 1 a harmadik 0, a második 
egyenletből pedig a h21, h31, hai hármasra következik hasonló állítás. Az egyik 
számhármas lehet tiszta 0 is, ha a másik nem az. Látható, hogy a H" mátrix má- 
sodik és harmadik oszlopára is igaz lesz az, hogy a (hi: ,hz:,hs5:) és a (ho: ,hs: hai) 
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számhármasok egyikének pontosan kettő eleme lesz 1, a harmadik nulla, a másik- 
nak pedig vagy 2, vagy 0 eleme lesz 1. Írjuk fel az összes olyan oszlopot, amelyre 
ez teljesül: 


1 1 0 1 1 0 
1 0 1 1 0 1 
1 1 1 0 0 0 
0 1 0 1 0 1 
0 0 1 1 1 0 


Ebből a hat oszlopból kell hármat kiválasztani úgy, hogy a belőlük felépített 
mátrixnak ne legyen sem ismétlődő, sem pedig tiszta nullából álló sora. Egy 
megoldás: 


HT — 


OOKR E. 
DP EOE O 
E 


Az oszlopok tetszőlegesen felcserélhetők, és máshogy is megválaszthatók. 
A v vektor szindrómája: 


s(vv—v:-HT-(10111)- — (010). 


DPOB EE 
DP EOE OO 
EOOO-L 


A v vektor nem kódszó, a szindrómája tényleg nem 0. 


8.2.1. Szisztematikus kódok paritásellenőrző mátrixa 


244 


Ha szisztematikus a kódunk, akkor A paritásellenőrző mátrix előállítása igen 
egyszerű. Szisztematikus kódok esetén ugyanis nem csak a G generátor- 
mátrix első k oszlopa alkot egységmátrixot, hanem a H" paritásellenőrző 
mátrix utolsó n — k sora is. A maradék k x (n — k)-s mátrixok a G végén, 
illetve HT felső részén egymás ellentettjei lesznek. Ennek oka a következő: 


G és H" felírható, mint 


/ 
G — (Ixxk.Prkxínam), illetve nr ( kx(n-k) J 
( . 2 ) In-k)x(n—k) 


244 


A GH! mátrixszorzás során az i-edik sor j-edik elemének előállításakor 
a G mátrix i-edik sorát szorozzuk a H" mátrix j-edik oszlopával. AG 
mátrixból vett vektor első k eleme közül csak pont az z-edik lesz 1, a 
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többi 0. A fennmaradó n — k elem P i-edik sora. A HT-ből származó 
vektorra, hasonlóképpen, az első k elem lesz a P" j-edik oszlopa, a maradék 
k közül pedig csak a j-edik lesz 1, a többi nulla. Szorzásukkor a sorvektor 
egységmátrixból származó része az oszlopvektor P"-ből származó részével 
kerül össze, s mivel az első vektorból csak az 7-edik elem nem nulla, csak 
az ad nem nulla szorzatot a (8.2) összeg első k tagja közül. Ennek a résznek 
az eredménye tehát P; (P" j-edik sorvektorának i-edik eleme). A második 
n — k tagnál hasonló helyzet következik be, csak a második vektorból 
származik az egyetlen 1-est tartalmazó rész, az elsőből a P, az eredmény 
pedig P;j (P i-edik sorvektorának j-edik eleme). A teljes összeg nullát kell 
hogy adjon, mivel GHT — 0, tehát P;j — —Pi;. Ezn — 5, k — 3 esetre 
például az alábbi szerint alakul: 


Ph P12 
1 0 0 Pi1 Pi2 Ph Pha 
0 1 0 Pa Pa [-I Ph PS 
0 0 1 Pz Pz 1 0 
0 1 


A vastag szedéssel kiemelt első sor, illetve második oszlop szorzásakor az 
eredmény 1 - PJ5 -- Pia : 1. 


8.2.2. Egy szindróma által generált mellékosztály és a hibajavítás 


Térjünk vissza a vett v szimbólumsorozat hibáit kijavító dekódolás lehető- 
ségeihez. Vegyük észre, hogy a v vektor szindrómája tulajdonképpen csak 
a v-nek a c-től való eltérésének és a paritásmátrixnak a szorzata, azaz, ha 
v — c 3 Ac, akkor 


s5—v:-H! —(c4Ac)-HF—03Ac. HT, 
mivel a mátrixokkal való szorzás is disztributív, és c : HT — 0. 


8.3. Példa: Adjuk meg a 8.2 példában szereplő v — (1 0 1 1 1) vektor 
lehetséges hibavektorainak a szindrómáját. 


A 8.1 példa alapján a lehetséges kódszavakat, és azok v-től vett eltérését a követ- 
kező táblázat tartalmazza: 


























C; ÁAc;— €p—Vv 
(00000)] (10111) 
(01110) ] (11001) 
(10101)] (00010) 
(11011)] (01100) 
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Ha bármely Ac; vektor szorzatát kiszámoljuk a 


HT — 


OOKR E E 
9 EO LE. 
EG OL 


mátrixszal, akkor a szindrómának s(Ac;) — (0 1 09-t kapunk. 


Dekódolás során legtöbbször a vett v vektor szindrómája alapján meg- 
becsülik a Ac hibavektort, és ezt levonva a v-ből, megkapják az üzenetet, 
vagy legalábbis egy becslést arra, mi lehetett az üzenet. Mivel a vektoraink 
elemszáma n véges, véges sokféle Ac hibavektor fordulhat elő. Ha az egyes 
Ac;-khez hozzáadjuk a K kód elemeit, akkor megkapjuk a belőlük létrejövő 
v vektorokat. Az így létrejött M; c C" halmazt a Ac; hiba által generált 
mellékosztálynak nevezzük. 

Bizonyos Acj hibamintázatok előállnak egy másik Ac; hibából egy 
kódszóvektor hozzáadásával, azaz Ac; -- cx alakban. Ezek a hibamintá- 
zatok tehát nem generálnak külön-külön mellékosztályt, hiszen ugyanazt 
a halmazt kapjuk belőlük, csak az elemek sorrendje lesz más. Egy-egy 
mellékosztály elemei így nem csak a lehetséges vett v vektorok, hanem a 
kódelemeket az adott v-kbe vivő Ac; hibavektorok is egyszerre. (Hiszen 
lineáris kódokról van szó, azaz a nullvektor is érvényes kódszó, az meg 
minden hibát önmagába visz.) 

A mellékosztályok elemeit súlyuk szerint sorrendbe szokták rakni. Egy 
V — (WU, ... Un) E C" vektor uw(v) súlya a nem nulla v; szimbólumainak 
száma. A mellékosztály vezető elemének a legkisebb súlyú elemét neve- 
zik. 

"Egy kód wmin minimális súlyán a nem nulla kódszavak súlyai közül a 
legkisebbet értik. Ez egyben a minimális kódtávolság is. 


Természetesen egy v-t többféle hibavektorból más és más c € K-val 
is megkaphatunk, de ugyanaz a v csak egy M; mellékosztálynak lesz ele- 
me. Egy M; mellékosztály elemei mindig ugyanazt az s; szindrómát adják. 
El kell tehát dönteni, hogy dekódolás során az azonos mellékosztálybe- 
li Ac hibavektorok közül melyikkel számoljuk ki az üzenetet. Vegyük 
észre, hogy a legkisebb súlyú elem, azaz a mellékosztály vezető eleme 
adott szindróma mellett a csatorna legkisebb hibáját tételezi fel. (A Ac; 
hibavektorban található nulla szimbólumok helyén nincs hiba, csak a nem 
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nulla szimbólumok helyén.) Ezért, ha a v vett vektor szindrómája s;, a 
legegyszerűbb döntési séma arra nézve, hogy melyik M;-beli elem legyen 
a hibánk, egyszerűen kiválasztani a mellékosztály vezető elemét, Ac; o-t. 
Így a vett üzenet c — v — Ac;o lesz. Az egyes szindrómákhoz tartozó 
minimális súlyú hibákat táblázatban lehet tárolni. 


8.4. Példa: Adjuk megav — (101 1 1) vektor, mint lehetséges hibamintá- 
zat által a a 8.1 példában szereplő kódszavakból generált mellékosztályt. 
Javítsukkiav — (1011 1) vektort a mellékosztály vezető elemével. 

Av -(10111) — Ac, hibamintázat által generált mellékosztályt úgy kapjuk 


meg, hogy minden lehetséges kódszóhoz hozzáadjuk a szóban forgó hibavektort. 
Lássuk: 





























i C; Ac; — c; 4 Acy 
01(00000) (10111) 
11(01110) (11001) 
21(10101) (00010) 
3]1(11011) (01100) 








A táblázat harmadik oszlopa tartalmazza a mellékosztály elemeit. A legkisebb 
súlyú elem nyilvánvalóan a második, amelyik vastag szedéssel ki van emelve, 
hiszen az csak egyetlen nem nulla komponenst tartalmaz. Ezzel kijavítva a v 
vektort a 

v—Ac2—(10111)—(00010)—(10101)— cz 


kódszót kapjuk. 
Bármely Ac;-ből kiindulva ugyanezt a mellékosztályt kapjuk. Nézzük például 


a Ac1-et, mint kiindulási elemet: 





























i c; Acz — c; HF Aci 
01(00000) (11001) 
11(01110)] (10111) 
21(10101) (01100) 
3]1(11011) (00010) 





A másik két hibamintázatból kiindulva hasonlóan ellenőrizhető az állítás igazsága. 
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9. Hamming-kód 


Hamming-kódoknak nevezzük azokat a perfekt hibajavító kódokat, ame- 
lyek egy hibát képesek kijavítani. A Hamming-kódok konstrukciójakor 
az alapvető feladat tehát adott n — k számú paritásbithez megtalálni a 
maximális k üzenethosszat - s egyben a maximális n kódszóhosszt - úgy, 
hogy egy hibát javítani tudjunk. 


Matematikai kitérő - Véges számtestekről avagy a Galois- 
testekről. Vegyünk egy számokból álló véges elemszámú GF(N) — 
(tata, . . . tn ) halmazt. Értelmezzünk a halmaz elemei között két mű- 
veletet, a ,,-"-szal jelölt összeadást és a ,,-"-tal jelölt szorzást úgy, hogy 
egyik művelet se vezessen ki a halmazból - azaz hat c GF(N) és 
u € GF(N), akkort 3 u € GF(N) és t - u c GF(N). Akkor nevezzük 
a halmazunkat véges számtestnek, vagy Galois-testnek (Galois Field), 
ha ezen kívül 


1. az összeadásra igaz, hogy 
(a) tt u — u-t, azaz az összeadás kommutatív, 
(b) has € GF(IV), (54t) u — s-4(t-3-u), az összeadás asszociatív 
is, 
(c) létezik egy nullelem, amely minden t c GF(N)-nel összead- 
va az eredeti t-t adja: ha a nullelemet 0-val jelöljük, t -- 0 — t, 
(d) minden t c GF(N)-nek létezik egy ellentett eleme, amellyel 
összeadva 0-t ad eredményül. Ha t ellentettjét (—t)-vel jelöl- 
jük, akkor t -- (—t) — 0; 
2. illetve a szorzásra teljesül, hogy 
(a) t - u — u - t, azaz a szorzás kommutatív, 
(b) ha s € GF(N), (s :t) : u — s : (t : u), a szorzás asszociatív, 
(c) létezik egy egységelem, amely minden t c GF(N)-nel meg- 
szorozva az eredeti t-t adja: ha az egységelemet 1-gyel jelöljük, 
E: e5 
(d) minden t e GF(N)-nek (t £ 0) létezik egy inverz eleme, 
amellyel megszorozva 1-et ad eredményül. Ha t inverzét 
(t71)-nel jelöljük, akkor t : (t71) — 1, 
3. továbbá a két művelet együttes alkalmazására a következők iga- 
zak: 
(a) ha s c GF(N) (és s - 0), akkor s - (tu) — s-t - s :- u, tehát 
igaz a disztributivitás, 
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(b) 0 - t — 0. Emiatt a nullelemnek nincsen inverze. 


A Galois-test definiálásakor nem elég csak a GF(N) alaphalmazt defi- 
niálni, hanem a halmazon értelmezett összeadás és szorzás értelmezése 
is szükséges. 


Véges test például a GF(2) — (0.1), ha az összeadásra igaz, hogy 
1 7-1 — 0, azaz ha az eredmény kivezetne GF(2)-ből, akkor a kettővel 
való osztásának a maradékát vesszük eredménynek. 


Ez a módszer általánosítható kettőnél nagyobb N prímszámokra is: 
Vegyük a GF(N) — (0,1,... N — 1) halmazt. Ha az összeadást a 
szokásos algebrai összeadásként értelmezzük (illetve a szorzást is 
a szokásos szorzásként) azzal a megkötéssel, hogy ha az eredmény 
kivezetne GF(N)-ből, azaz nagyobb lenne, mint N — 1, akkor annak az 
N-nel való osztása utáni maradéka lesz az eredmény. Egy a szám 6-val 
való osztása után keletkezett ó maradékára az 


azó modő8 


jelölést szokás alkalmazni (a ekvivalens ó-val moduló 6-ként olvasan- 
dó). Ha egy 8 szám maradék nélküli osztója egy másik a-nak, azt az 
alábbi módon lehet jelezni: 


az0 mod06. 


Szükséges az ellentett és az inverz elemek definiálására, a többi pont 
teljesülése egyszerűen ellenőrizhető. 


e Vegyünk egy t ec GF(N) elemet, ennek a hagyományos algeb- 
ra szerinti ellentettje, —t Ca 0, tehát nincs a halmazunkban. Az 
(N-t) azonban GF(N) eleme, és az N-nel adott maradéka ugyan- 
annyi, mint —t-nek, így ő lesz t ellentettje. Tehát az ellentett elem 
kereséséhez a 

—tEsN-tmodN (9.1) 


azonosságot kell használni. 


e Az inverz létezésének belátásához van szükség arra, hogy N 
prímszám legyen. Ekkor ugyanis egyik t c GF(N) elem sem 
osztója N-nek, tehát két elem szorzata csak akkor lehet nulla, ha 
az egyik elem a 0. Ebből az következik, hogy ha egy tetszőleges 
t ec GF(N)-nel megszorozzuk GF(N) minden elemét, az így 
kapottt-GF(N) — (t:0,t- 1, . . . t : Ny halmaz minden eleme más 
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és más. 

(Ha ugyanis s 7 u és ssu c GF(N) lenne, és fennállna, hogy 
t-s —t-u,akkort:(s— u) — 0 lenne, így s— u — 0, ami ellentmond 
a kezdőfeltevésnek. Lehet még t — 0, de az érdektelen, hiszen a 
nullelemnek nincsen inverze.) 

Így t - GF(N) — GF(I), csak az elemek sorrendje cserélődhet fel, 
tehát valamelyik elemmel való szorzata t-nek feltétlen 1 lesz. Ez 
az elem lesz a t inverze. (Hogy melyik, azt ki kell próbálni.) Iehát 
az inverz elem kereséséhez a 


t-4t1-1modN (9.2) 


egyenletet kell megoldani. 


9.1. példa: Adjuk meg a GF(5) véges test elemeinek az ellentettjeit és inver- 
Zeit. 


Megoldás: A 0, 1, 2, 3 és 4 számok ellentettje GF (5)-ben: 


—0—-(5—0)—-0mod5 
—1zs 5—1 —-4mod5 
—27s 5—2 —-3mod5 
—37 5—3 -2mod5 
—47 5—4 —-1mod5 


Látszik, hogy az ellentettek párban vannak: 1 ellentettje 4, és 4 ellentettje 
1... Az iverzelemeket számolásához a legegyszerűbb, hogyha elkészítjük a 
GF(5)-beli szorzótáblát: 








x]J0O0 1 2 3 4 
010 0 0 0 0 
1]0 1 2 3 4 
2]0 2 4 6-1mod5  8-3mod5 
3 10 3 6-1mod5 9-4mod5 12—-2mod5 
410 4 8-3mod5 12—2mod5 16-1mod5 














A táblázatból elolvasható, hogy a 0 elemnek nincs inverze, az 1-é önmaga, a 
2-é a 3, a 3-é a 2 a 4-é pedig szintén önmaga. Természetesen, ha csak egyetlen 
elem inverzét keressük, akkor nem kell az egész táblázatot megcsinálni, 
egyszerűbb elkezdeni az elemet beszorozni az 1-nél nagyobb GF(N)-beli 
elemekkel és vizsgálni a kapott szorzatok n-nel való osztás utáni maradékát. 
Ha 1-et kaptunk, megtaláltuk az elem inverzét. 
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Egy t ec GF(N) elem hatványait is értelmezhetjük önmagával vett 
szorzatainak egymásutánjaként, azaz ha ismert t! — t, akkor 


81-11. (9.3) 


At A 0 elem rendjének azt a legkisebb o 5 0 egész számot értjük, 
amelyre 
1-1. 


Az 1 elem rendje értelemszerűen 1. 


Ha egy t - 0 elem rendje N — 1, akkor annak a nulladik és az első 
N — 1 hatványa mind különböző, azaz az összes GF(N)-beli elem 
előáll t valamelyik egész hatványaként. Az ilyen elemeket GF(N) 
primitívelemeinek nevezik. Ha N prím, mindig van primitívelem. 


9.2. példa: Vegyük az N — 5 esetet. Adjuk meg a GF(5) elemeinek a 
hatványait és keressünk egy primitívelemet a számtesten belül. 


Megoldás: Az 1-nél nagyobb elemeket, hatványaikat és rendjeiket a követke- 
ző táblázat mutatja: 











tlíé]leélTt TT rend 
214]13/1 4 
3]4]12]1 4 
411]4]1 2 


























A primitív elem itt például a 3. 


9.1. Bináris Hamming-kód 


A bináris kódoknál mind a b € B? üzenetek, mind pedig a c c K kódsza- 
vak bináris vektorok, azaz csak nullákból és egyesekből állnak. Elegendő 
ekkor azt megtudnunk, hogy a vett szimbólumsorozat hányadik helyén 
van a hiba, a javítás ennek ismeretében könnyen elvégezhető. 

Írjuk fel a kódunk paritásmátrixát a következő módon: Jelöljük HT 


sorvektorait h;-vel, i — 1.2, . . . n, azaz legyen 
hi 
ho 
H — . § (9.4) 
hn 
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A sorvektorok hossza n — k. Ha csak egy hiba fordul elő a kapott v vektor- 
ban, akkor annak a Ac hibavektora legfeljebb egy darab 1-est tartalmazhat, 
a többi eleme nulla lesz. Iegyük fel, hogy a j-edik elem az 1. Egy ilyen 
sorvektorral megszorozva a paritásmátrixot, megkapjuk H! j-edik sorát, 
h/-t. Így ahhoz, hogy megkapjuk a H T paritásmátrixot, egymás alá kell 
írnunk az összes lehetséges nem nulla szindrómát, azaz az egyesekből és 
nullákból összeállítható megfelelő hosszúságú sorvektorokat. 

H oszlopainak száma, így az s szindrómák hossza n — k. Az összes 
lehetséges (nem nulla) szindróma száma 277" —1 (kételemn—k helyen való 
ismétléses variációja, a tiszta nullából álló elem kivételével). Ez azt jelenti, 
hogy nem minden n kódszóhosszhoz s nem minden k üzenethosszhoz lehet 
bináris Hamming-kódot találni. Az első néhány lehetséges számhármast a 
következő táblázatban láthatjuk. 

















n—k]n-27FR-1lÍk 
2 3 1 
3 7 4 
4 15 11 
5 31 26 
6 63 57 








Ha szisztematikus kódot szeretnénk, akkor a paritásellenőrzési mátrix 
utolsó n—k sorába hagyjuk az egy darab 1-est tartalmazó vektorokat, és úgy 
rendezzük el őket, hogy H? alján egységmátrix legyen. A G generátormát- 
rix ebből a (8.5) egyenlet utáni megjegyzés alapján könnyen elkészíthető. 
Egy n — 7, k — 4-es Hamming-kód paritásellenőrző mátrixa lehet például: 


111 
1 1 0 
10 1 
H/—-fo11]l, (9.5) 
10 0 
0 1 0 
0 0 1 
Az ehhez tartozó generátormátrix 
1000111 
0100110 
6§— 10010101 éb) 
0001011 
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Az említett megjegyzéssel összhangban a két mátrix vastag szedéssel ki- 
emelt része egymás ellentettje kell, hogy legyen. Bináris esetben — mivel 
1-3 1 — 0, azaz az 1 ellentettje önmaga - ez tulajdonképpen azt jelenti, hogy 
a két mátrixrész azonos. 

Nézzünk egy számpéldát. 


9.3. Példa: A kódunk generátor- és paritásellenőrző mátrixa legyen a (9.6), 
illetve (9.5) szerinti. Kódoljuk a b — (0 1 0 1) üzenetvektort. 


A kapott kódszó: 


1000111 
c—b:G—(0101)- § § 5 ; j § a —(0101101). 
0 001011 


été 


9.4. Példa: Tegyük fel, hogy a csatorna a 9.3 példában előállított c vektor 
továbbításakor a második pozícióban lévő elemet elrontotta, így a vett 
vektorrv — (000110 1). A kérdés, hogy mivé dekódoljuk a v vett 
szimbólumsorozatot. 


Számoljuk ki v szindrómáját. 


s—v:-HT—-(0001101)- —(110), 


POROS KE 
PEDEÉEOEKO S.K 
FOOS KO KR 


eza HT paritásmátrix második sora, eszerint a csatorna a második helyen rontott. 
A v vektort a dekódolás során a (010 1 1 0 1) érvényes kódszóba javítjuk. Mivel 
a kód szisztematikus, a dekódolt üzenetet úgy kapjuk, hogy elhagyjuk a javított 
kódszó utolsó 3 elemét (a paritásszegmensét), a dekódolt üzenet tehát (010 1) 
lesz. 


9.5. Példa: A Hamming-kódok egyetlen hiba kijavítására alkalmasak. 
Mit történik, ha mégis többet hibázik a csatorna? Torzuljon a 9.3 pél- 
dabeli (0 1 0 1 1 0 1) kódszó a második és az ötödik helyen, így a 
v. —(000100 1) vektort próbáljuk dekódolni. 
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A szindrómája: 


s—v:HT—-(0001001)- — (010), 


1 me E em BEEE EE E nöt ai 
EPDEÉEOBOLR K.K 
FOOSB EOK 


ami a paritásmátrix hatodik sora, tehát a dekódolás során a hatodik bitet cseréljük 
ki, a kapott kódszó (000 1 0 1 1), a dekódolt üzenet (0 0 0 1) lesz, ami nem az 
eredeti üzenet. 


9.2. Nembináris Hamming-kódok 


Legyen a rendelkezésre álló szimbólumok száma N. Mivel a kódábécé 
nem csak 0-ból és 1-ből áll, a hiba nagysága is lehet 1-nél nagyobb. Legyen 
a hibánk az i-edik pozícióban, Ac nagyságú. Ekkor a szindrómája, azaz 
a (9.4) alakú HT paritásellenőrző mátrixszal vett szorzata s — Ac :- h; 
lesz. Ha minden h; olyan, hogy az első nem nulla eleme 1, akkor a hiba 
s szindrómájának első nem nulla eleme pont a hiba nagysága, Ac lesz. A 
hiba pozícióját úgy határozzuk meg, hogy a szindrómát osztjuk első nem 
nulla elemével - tehát vesszük s/Ac-t -, ami megadja h;-t. (A Ac e GF(N) 
számmal való osztás helyett természetesen a (Ac)"! e GF(N) számmal 
szorozzuk a szindrómát.) HT ismeretében i megkereshető. Így mind a hiba 
nagysága, mind pedig a helyzete ismert lesz. 

A HT paritásellenőrző mátrixnak tehát olyannak kell lennie, hogy tar- 
talmazza az összes olyan n — k hosszúságú sorvektort, amely nem csupa 
nullából áll, a (0.1, . . . N — 1) halmaz elemeiből építkezik, és az első nem 
nulla eleme 1. Adott n — k számú paritásbit mellet az n kódszóhossz — azaz 
a fenti tulajdonságú sorvektorok száma - a következő: 


Nr"-k. 1 


NENT 


(Az eredményt úgy kapjuk, hogy az N elem n — k helyen vett ismétléses 
megkapjuk az összes lehetséges n — k elemű, nem nulla vektor számát. 
Mivel az első nem nulla elem az (1,2, . . . N — 1) halmazból bármi lehetett, 


a csak ebben az elemben eltérő vektorok száma pont N — 1. Ezek közül 
minket csak egy érdekel — amelyiknek 1 az első nem nulla eleme -—, ezért kell 
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az előbbi eredményt N — 1-gyel osztani.) Ha a fenti eredményt átrendezzük, 
az 
N"-F-14n(N-1) 


egyenlőséget kapjuk. Ha a (7.17) gömbpakolási korlátot vagy Hamming- 
korlátot r — N, v — 1-re kiírjuk (két tag lesz az összegben) a következő 
egyenlőtlenséget kapjuk: 


N".(14n(N—1)) c N" 


Összevetve ezt a fenti egyenlőséggel és azzal, hogy az olyan kódokat, 
amelyek a Hamming-korlátot elérik, azaz az egyenlőség érvényes, perfekt 
kódnak nevezzük, megállapíthatjuk, hogy a Hamming-kódok perfekt kódok. 

Példaként nézzünk egy olyan szisztematikus Hamming-kódot, amely- 
ben n — k — 2, azaz a paritásszegmens hossza 2. Ekkor, mivel H" utolsó 
két sora az egységmátrixnak kell, a maradék n — 2 sort kell különböző vekto- 
rokkal feltölteni. Ezen vektorok első eleme mindenképpen 1, hiszen az első 
nem nulla elem 1, az egyetlen olyan vektor pedig, amelynek az első eleme 0, 
és csak a második 1, az utolsó sorban szerepel. Szintén az egységmátrixban 
szerepel az (1 0) vektor is, tehát H" felső sorainak második elemei csak 
(1,2, . . . N — 1]-ből kerülhetnek ki, tetszőleges sorrendben. (Ilyen sorvek- 
torbóltehátN-—-1van így N—-1—késn—k-42— N 7-1.) Hatehátt a 
kódábécé primitív eleme, akkor egy (N -- 1,N — 1) paraméterű nembináris 
Hamming-kódhoz jó paritásmátrix a 


1 1 
1  t 
1 6 

Hf—-I : : i (9.7) 
1 1-2 
1 0 
0 1 


A generátormátrix a bináris esethez hasonlóan állítható elő, csak az ellentett 
elemekre kell figyelni. 


9.6. Példa: Konkrétabb számokkal, ha N — 5 (elemei a fejezet elején, a 
matematikai kitérőben fel vannak sorolva, rendjükkel egyetemben), a pri- 
mitív elem a 3. Készítsük el a GF(5)-ben értelmezett, (6.4) paraméterű 
nembináris Hamming-kód paritásellenőrző és generátormátrixait. 
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Az ellentett elemek párokba rendezve a következők: (1,4) és (2,3). Ekkor a 
paritásellenőrző mátrix 


1 1 
1 3 
r.l14 
H-[f JT 2]. (9.8) 
1 0 
0 1 
a generátormátrix pedig 
1 0 0 0 —(1) —(1) 1000 0 4 4 
5.10 10 0 —-(1) -BI [010042 
Szf[avio-4 ig [lo oi0d 1 425 
0 0 0 1 —(1) —(2) 000 1 43 


A (9.8) H" mátrix sorait felcserélve szintén jó paritásmátrixot kapunk, 
de a generátormátrix is más lesz, nem (9.9). 


9.7. Példa: Kódoljuk a b — (3 0 4 1) üzenetet a (9.9) generátormátrixú (6,4) 
paraméterű nembináris Hamming-kóddal. 


0 0 0 


c—b:-G— (3041): —(304124). 


HB HA 
WE WKI 


ta a e E 


10 0 
0 10 
0 0 1 


9.8. Példa: Dekódoljuk a (9.8) paritásellenőrző mátrixszal rendelkező kó- 
doló által a csatornára bocsátott kódszóból torzultv— (302124) GF(5) 
feletti vektort. 

Első lépésként kiszámítjuk a vektor szindrómáját: 


s—s:-HT-(302124)- 


ORE EE E 
FON WA WE 


Felhasználtuk, hogy 8 — 3 mod 5, és 17 — 2 mod 5. 
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A hibanagyság tehát a szindróma első komponense, azaz Ac — 3. Elosztjuk a 
szindrómát a hibanagysággal: 


A -s.(Ac)71—(3 2).2—(1 4) mod 5 

Ac 

Itt azt használtuk, hogy a véges testekben egy szám inverze az a véges testbeli elem, 
amellyel a számot megszorozva 1-et kapunk. Jelen esetben 3-2— 6-— 1 mod 5. 
Az így kapott vektor a H" mátrix egyik sora kell, hogy legyen: az is, al harmadik 
sor. Ez azt jelenti, hogy a harmadik helyen van hiba, így a v vektor harmadik 
komponenséből vonunk le Ac — 3-at. A kapott kódszó: 


cv—(302124)—(003000)—(304124), 


így, mivel (2 hosszúságú paritásszegmenssel rendelkező) szisztematikus kódról 
van szó, a dekódolt üzenet: bv — (3041). 
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10. Ciklikus kódolás 


Egy c — (co,c1, . . . /n—1) vektor ciklikus eltoltján egy olyan vektort értünk, 
melynek az elemei ugyanazok, mint c-nek, csak eggyel jobbra tolódva, cn-1 
pedig -— mivel jobbra már nem tudott tolódni - a vektor elejére került. Ha a 
ciklikus eltolás operátorát 5-sel jelöljük, akkor matematikai formulákkal c 
ciklikus eltoltja az 

Sc — (Cn—1,C0,C1; b. Cn—2). (10.1) 


Egy K kódot ciklikusnak nevezünk, ha minden c € K kódszóra Sc € K. 
Abból, hogy egy kód ciklikus, nem következik az, hogy lineáris is, 
lássuk: 


10.1. Példa: Legyen K — (000,100,010,001,111). Vajon lineáris-e ez a cikli- 
kus kód? 

Ha K lineáris, érvényesek rá a vektortér-axiómák. Ezek közül vizsgáljuk azt, hogy 
a K elemei közötti összeadás nem visz ki a K halmazból. Nézzük a második és 
harmadik elem összegét, az 110, ami nem eleme K-nak, így nem kódszó, tehát ez 
a kód nem lehet lineáris. 


Mivel a ciklikus kódokat a legegyszerűbben a kódszavakhoz rendelt 
polinomok segítségével kezelhetjük, szükség lesz egy újabb matematikai 
kitérőre. 


Matematikai kitérő — A véges testeken értelmezett polinomokról és 
a polinom-véges testekről. Vegyünk egy GF(N) Galois-testet. A 
t e GF(N) elem n-edik hatványát értelmezzük a (9.3) szabály szerint. 
A 


(0) — pot pi:t4p2:BYr...FDm tt" (10.2) 
kifejezést a GF(N) véges test feletti polinomnak nevezzük, ha min- 
den p;, i — 0.1, . . . m együttható a Galois-testünk eleme, azaz p; € 
GF(N). 


Egy p(t) polinom egyenlő egy másik, p (t) polinommal, akkor és csak 
akkor, ha minden i-re p; — p;, azaz az együtthatóik megegyeznek. A 
p(t) polinomban szereplő legmagasabb m kitevő a polinom fokszáma, 
melyre az alábbi jelölést alkalmazzuk: 


deg p(t) — m. 
A Galois-testek polinomjai között is lehet összeadást és szorzást defi- 


niálni 
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e A p(t) és a(t), GF(N) Galois-test feletti polinomok r(t) — p(t) -- 


g(t) összegén azt a polinomot értjük, melynek együtthatói az 
ri; — pi 4 as GF(N)-en értelmezett (moduló N) összeadás szerint 
állnak elő minden --re. 


e A p(t) és g(t), GF(N) Galois-test feletti polinomok r(t) — p(t) :g(t) 


szorzatán azt a polinomot értjük, melynek együtthatói az 


r— X Dj" di—j (10.3) 
jSi 


GF(19-en értelmezett szorzásokból álló moduló N összegként 

állnak elő minden --re. 
A polinomokat úgy szorozzuk össze, hogy a p(t) — po -- pit -- 
pot? - ... ht pmt" összeg minden tagját a g(t) — go 4 git 4 
got? - . . . 4 gnt" összegnek minden tagjával összeszorozzuk, 
majd rendszerezzük az így kapott tagokat fokszámuk szerint, 
és az azonos hatványú t-vel rendelkező tagok együtthatóit 
összevonjuk. Így keletkezett a fenti összeg. A két polinom 
fokszáma lehet különböző, és a szorzás eredményének a fok- 
száma meghaladhatja mindkét polinom fokszámát (m-et és 
n-et is), de nem lehet nagyobb m -- n-nél. 


H-—-—-—-—- tö a 





Vegyünk egy p(t) és egy a(t) GF(N) feletti polinomot úgy, hogy 
deg p 5 deg g. A p-nek a a-val való osztását a következőképpen 
lehet elvégezni: 


I. 


II. 


III. 


Ha deg p — m és deg g — nm, illetve a p(t)-ben t" együtthatója 
Pm, 4(t) legmagasabb fokú tagjának együtthatója pedig gn, akkor 
szorozzuk meg 9(£)-t 


pe-m Het Pm m-m 


dn 


Tm-—n -nel. 

Vonjuk le az így kapott polinomot p(t)-ből. A különbség m-edik 
fokú tagjának nulla az együtthatója, tehát a különbség fokszáma 
legfeljebb m — 1. Jelöljük most a különbséget s(7- (t-vel. 
Ismételjük meg az I. és II. lépést úgy, hogy p helyére mindig az 
előző lépésből maradt s"(t)-t tegyük, egészen addig, amíg az új 
maradék fokszáma kisebb nem lesz, mint n, a g(t) fokszáma. 
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IV. Az eredmény 
p(t) — g(dr(t) — s (2). (10.4) 


Nézzünk egy konkrét példát: 
10.2. példa: Legyen p(t) — 4t? 4-2t 4 41? 4-t 3-3 és g(t) — 2t— 3. Adjuk meg 
a két polinom hányadosát és maradékát. 
Megoldás: 
1. deg p— 5 és deg g — 1, így g(t)-t 
4 
rat" — -t-nel 
szorozzuk meg. Az eredmény 4t7 — 6tt. Ezt p(t)-ből levonva s(9(t) — 


Bt 4 4t? 3 t 7 3-at kapunk. 


2. s(9(t) fokszáma 4, a negyedfokú (legmagasabb fokszámú) tagjának 
együtthatója 8, így 


8 
pszt. 
T3 p 


Ezt a kifejezést ag(t)-vel megszorozva, majd s(9(t)-ből levonva s(? (t) — 
124? 4 412 3-t 4 3 marad. 


3. s((t) fokszáma 3, a köbös tagjának együtthatója 12, tehát a(t)-t 
12 
rot? — a ötel 


szorozzuk. A p(t)-től való eltérés s) (t) — 2282 4 t 4 3. 
4. Ebben a lépésben 


22 
rit! — 54 
a különbség pedig s((t) — 34t- 3. 
5. Végül 
rot? ei sss 
2 


9(t)-t ezzel megszorozva 34t — 51-et kapunk, s((t) — 34t -- 3-ból ezt 
levonva 54 marad. 


6. Az osztás eredménye: 
45 3 241 7 442 1-t 3 3 — (2t— 3)(2t! 7 46? 14-64? 1-11t 73-17) 4 54 


Ezen megoldásnál feltettük, hogy N elég nagy prímszám (54-nél nagyobb). 
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10.3. példa: A 10.2 példa GF(7)-ben a következőképpen néz ki 


Megoldás: Először is a —3 nem eleme GF(7)-nek, így az osztópolinom (2t--4) 
lesz, mivel —3 — 4 mod 7. Ezen kívül, a 2 inverzeleme az a szám, amellyel 
megszorozva 1-et kapunk, (moduló 7), tehát 2-! — 4. Ezek szerint, ahol az 
iménti példában 2-vel osztottunk, most 4-gyel szoroznunk kell. 





























At? 3-2 7-OL? 4412 1t 3 — (2t-4 4): (2t1 -- 4t? - 64? 1 4t 4-3) — 5. 
—atő —14 (4.2—8-—1mod7) 
16 -FOt? --4t2 --1t 3 (—142-1mod7) 

—1tt —2t (1.27! — 454-4— 165 2 mod7) 
549 -3-4t2 41t 3 (—2—- 5 mod 7) 

—5t? —3t? (5.271! — 20 — 6;6-4— 24 — 3 mod7) 

142 7-1t 7-3 (—344-1mmod7) 

—1t2? —2t (1.27! —454-4— 165 2 mod7) 

6t 3-3 (—24155341— 6 mod7) 

—6t—5 (3-4—12—-5mod7) 

5 (—5413—-2143—5mod7) 








A sorok jobb szélén zárójelben az alkalmazott mod 7 műveletek láthatók. 


A számok maradékos osztásának példájára a polinomok maradékos 
osztását a következőképpen jelölik: 


p(t) 7 s979(t) mod a(t) 


ha a (10.4) egyenlőség jelöléseit alkalmazzuk. 


Egy p(t) polinom gyökei, vagy más szóval zérushelyei azok a t; € 
GF(N) véges testbeli elemek, amelyekre 


p(t.) — 0. 


Egy polinom gyökeinek a száma nem lehet nagyobb a fokszámánál. Tudva- 
levő, hogy ha t; a p(t) polinom gyöke, akkor (t — t;) maradék nélküli 
osztója p(t)-nek. A polinomokat szokás gyöktényezős alakjukban is 
megadni. Ha to ti, . . . tm egy m-edfokú p(t) polinom gyökei, akkor a 
polinom felírható a 


p(t) —(t— to): (4— ta): ... : (t— tm) (10.5) 


24 


formula szerint is. A (10.5) a p(t) polinom gyöktényezős felbontása. 
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Egy GF(N9-en értelmezett p(t) polinom irreducíbilis, hogy ha nem 
található nála kisebb fokszámú két GF(N ) feletti polinom, g(t) és r(t), 
amelyekre 
p(t) — a(t) :r(i) 

azaz ha az azonosan 1 függvényen és önmagán kívül nincs semmiféle 
GF(N) feletti polinomosztója. Ez a definíció, a GF(N) polinomjai kö- 
zül az irreducíbilisek kiválasztása emlékeztet a valós számok közül a 
prímszámok kiválasztására. Ugyanúgy, mint a számok között, a polino- 
mok között is létezik összeadás és szorzás, vonjunk tehát analógiát egy 
GF(N) test felett értelmezett, tetszőleges fokszámú polinomok és az 
egész számok között. Prímszámok voltak szükségesek a véges testek 
definíciójához, analóg módon, irreducíbilis polinomok lesznek szükségesek 
az új, polinom-Galois-testek létrehozásához. 
Legyen P(t) egy M-edfokú irreducíbilis polinom GF(N) felett. A 
GF(P(t)) halmaz tartalmazza a GF(N) feletti, legfeljebb M—1-edfokú 
polinomokat. A GF(P(t)) halmaz elemei között a következőképpen 
kell az összeadást és a szorzást definiálni ahhoz, hogy GF(P(t)) is 
véges test legyen, (teljesítse a Galois-testek előző kitérőben felsorolt 
axiómáit): 
e A g(t) c GF(P(t)) és r(t) e GF(P(t)) összegén azt az s(t) E 

GF(P(t)) polinomot értjük, amelyre 


s(t) s g(t) 4r(t) mod P(2). 


A g(t) E GF(P(t)) és r(t) e GF(P(t)) szorzata az az s(t) E 
"GF (P(t)) polinom, amelyre 


s(t) — g(t) :-r(t) mod P(t). 
Az egységelem, nullelem, inverz és ellentett elemek a GF(N) esetből 


egyszerűen általánosíthatók. 


10.4. példa: Legyen a P(t) — 1 t - t? másodfokú irreducíbilis poli- 
nom a GF(P(t)) legfeljebb elsőfokú GF(2)-beli polinomokat tartalmazó 
polinom-Galois-test definiáló polinomja. Adjuk meg a lehetséges polinomok 
összeadó- és szorzótábláját. 
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Megoldás: Az összeadások, mivel a GF(2) véges testben vagyunk: 


(0£--0) 4 (0£--0)—0t-BO —— (0£--1)-4(0£41)—-0t-3-2—0t-4-0 mod2 
(0t--1)-(0£--0)—0t-1 — (1t-3-1)4(0t41)—-1t-3-2—1t-40 mod2 
(1t--0) 4 (0£-0)—It-4O — (1t-3-0)-4(1t40)—-2t3-0—0t-40 mod2 
(1t--1)-(0t-0)—-It-E1 — (1t-41)4(1t40)-2t4-1—0t-41 mod2 
(1t--0)--(0£-1)—-1t-41 — (1t-4-1)4(1t41)—-2t32—0t-4-0 mod 2. 





























(10.6) 
Ebből az összeadótábla: 


Ot--0 ] Ot-1 ] 1t--0 ] 1t--1 
Ot--0 1 Ot--0 ! Ot--1 Í 1t-0 ] 1t-1 
O0t--1 1 Ot--1 ! Ot--0 Í 1t-1 I 1t-0 
1t--0 [/ 1t40 I 1t--1 ! Ot-0 ] Ot-1 
1t-1 I] 1t-1 ! 1t-40 1] Ot--1 ] Ot-0 
































A szorzások: 


(Ot -- 0) - (Ot 4 0) — 0£ 7-0 (0t-4-1) -(0t-41)— 01-41 
(0£-1)-(0t40)—0Ot40 — (0£-41)-(1t41)—1t41 
(1t--0) - (04-30) —0t--O0 — (1t--0)-(1t-40)—t? 
s1t-41mod(1-t--t?) 
(1t--1) -(0t-3-0)—0t--0 — (1t3-0)-(1t--1)—t2--t 
5 0t-1mod(1--t--t?) 
(1t 7-0) - (0t 41) — 11470 (1t--1) :(1t--1) — 123 2t 7-1 
st? 40t--1mod2 
5 1t-0mod(1--t--t?). 
(10.7) 

Az utolsó három sor második elemeihez használt P(t) — 1--t--t? polinommal 
való maradékos osztások során felhasználtuk, hogy GF(2)-ben vagyunk: itt 
ugyanis —1 — 1. A szorzótábla: 





























Ot--0 ] Ot-1 ] 1t-0 ] 1t--1 
Ot--0 [7 Ot--0 ] 0t-0 ! Ot--0 1 Ot--0 
Ot--1 [7 Ot--0 ! Ot--1 Í 1t-0 I 1t-1 
1t--0 1 Ot-40 ] 1t-0 I 1t-1 ] Ot-1 
1t-1 I! Ot--0 Í 1t-41 ] Ot--1 ] 1t-40 
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H-—-—-—- a 


Az összeadótáblából látszik, hogy a GF(P(t)) polinom-Galois-test 
nulleleme a Ot -- 0 polinom, hiszen azt bármelyik p(t) e GF(P(t)) 
polinomhoz hozzáadva p(t)-t ad eredményül. Hasonlóképpen, a 
szorzótáblából az adódik, hogy az egységelem a Ot -- 1 polinom, 
az, amelyikkel bármely p(t) c GF(P(t)) polinomot megszorozva 
önmagát kapjuk. Látszanak továbbá az ellentett- és inverz polinom- 
párok is. Például az összeadótábla megmutatja, hogy az 1t -- 0 elem 
ellentettje önmaga, mivel az önmagával alkotott összeg a nullelem. 
Hasonlóképpen, a szorzótáblából kiderül, hogy mondjuk az 1t 7-0 
polinom inverze az It -- 1, mivel a kettő szorzata az egységelem. 


10.1. Generátorpolinom és paritásellenőrző polinom 


Térjünk vissza a ciklikus kódjainkra. A c € K kódszavakhoz rendelhetünk 
polinomot az alábbi szabály szerint: 


C (Co,C1, : . . Cn—1) 


Ne I 


c(t) cg b cit 4 cott h... ken ati (10.8) 
A kódszavakhoz rendelt polinomok, vagy röviden kódszópolinomok hal- 
mazát jelöljük K(t)-vel. Ezzel a reprezentációval 

a kódszavak ciklikus eltolása t-vel való mod (t" — 1) szorzássá egyszerűsö- 
dik, 

tehát ha Sc — c", és a c! vektorhoz rendelt polinom c (t), akkor 


d(tb)—t-c(t) mod(t"—1). 


A polinomos leírással könnyű feltételt találni arra, hogy a kód lineáris 
legyen. Ha létezik egyetlen olyan nem nulla fokszámú kódszópolinom, 
melynek a fokszáma minimális és a legmagasabb kitevőjű tagjának az 
együtthatója 1, akkor a kód lineáris. Ezt a polinomot a kód generátorpoli- 
nomjának hívják, és g(t)-vel jelölik. A generátorpolinom fokszáma mege- 
gyezik a paritásszegmens hosszával: n — k-val. A g(t) minden c;(t) e K(t) 
kódszópolinomnak osztója, tehát minden c;(t) e K(t) felírható, mint 


ci(t) — ai(t) : 9(t) (10.9) 
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ahol az a;(t) polinom együtthatói a (8.1) egyenlőségben található a; vektor 
komponensei: a(t) — azot? 4 azt! A... ak onjtót 

Ha a generátorpolinomot legfeljebb n-edfokú polinomként fogjuk fel, 
akkor együtthatói go,g1, . . . 9n—k—1, 1.0, . . . 0 alakúak (a végén k db nullá- 
val). A kód generátormátrixa a generátorpolinom együtthatóiból felírható: 


go gi ... 9n-k—1 1 0 0 .. 0 
0 go 9gi ... 9dn—k—1 1 0 6.20 0 
GOf 3 d d he ; S ő ; (10.10) 
0 Ül: szg 0 go gi ... 1 0 
0 0 ... 0 0 go ... 9n-k—1 1 


A generátormátrixnak van polinom megfelelője, vajon a paritásellenőrző 
mátrixnak is lesz-e? A paritásellenőrző polinom megkonstruálásához nyújt 
segítséget a következő állítás: 

A generátorpoliom osztója (t" — 1)-nek. 

Bizonyítás: Az állítást úgy lehet belátni, hogy vesszük g(t)-nek a t"-!-nel, 
illetve t"-nal való szorzatát (az eltoltjait) és kivonjuk őket egymásból. Mivel 
mindkettő maradék nélkül osztható g(t)-vel, a különbségük is az lesz. 
Mivel t"-1 g(t) utolsó, n — 1-edfokú tagjának az együtthatója 1, a t"g(t)-nek 
az első, nulladrendű tagjának lesz 1 az együtthatója, az összes többi tag 
pedig t"-!g(t)-nek lesz a t-szerese. Így 


Vg) serital, 


és ennek a kifejezésnek oszthatónak kell lennie g(t)-vel. Az utolsó tag 
osztható, tehát az első kettő összegének is annak kell lennie, tehát t" — 1 
valóban osztható lesz g(t)-vel. (O.E.D.) 

A t" — 1 minden irreducíbilis osztópolinomja egy-egy kódnak a generá- 
torpolinomja. 


10.5. Példa: A GF(5) véges számtest felett a t" — 1 polinomnak a g(t) — €2 
4t 7-1 polinom irreducíbilis osztója. Adjuk meg a g(t) generátormpolinomú, 
GF(5) feletti (6,4) paraméterű ciklikus kód által a b — (2 3 0 1) üzenetből 
létrehozott kódszót 


Az üzenethez rendelt polinom: b(t) — 2 -- 3t 4 t?. A kódszópolinom ennek a g(t) 
generátorpolinommal vett szorzata a GF(5) számtest felett: 
b(t)-g(t) — (243146) -(154t-36)- 
z 2-3t-292-43t4-22-13810 rar b — 
2-4t-49-4? rat at mod[5. 
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Akapottkódszó:c— (214441). 
Alternatív megoldás: a kód generátormátrixa: 


1 4 10 00 0 
0 1 4 100 
G§G-[9§01410 
000 111 


A kódszót a b : G képlettel is megkaphatjuk. 


A 9(t) generátorpolinommal rendelkező n kódszóhosszú kód paritásel- 


lenőrző polinomja a 
1-1 
h(t) — 
V-B 


kifejezéssel adható meg. Ezzel lesz ugyanis 





(10.11) 


g(t) :h(b)—t"—1—-0 modt"-1, 


ami maga után vonja azt, hogy érvényes kódszavakra a szindrómapoli- 
nom s(t) — c(t) : h(t) z- 0 mod t" — 1. Egy érvényes kódszópolinom 
ugyanis c(t) — a(t)g(t) alakú, így ha megszorozzuk a h(t) paritásellenőrző 
polinommal, 


c(t)h(t) — a(b)ag(t)h(t) — a(t)(t"—1)—-0 modt"—1. 


10.6. Példa: Adjuk meg a 10.5 példában szereplő ciklikus kód paritásel- 
lenőrző polinomját. Számoljuk ki vele a v — (4 2 0 0 3 1) vett vektor 
szindrómáját 

A paritásellenőrző polinom a tf — 1 polinomnak és a generátorpolinomnak a 
hányadosa. A GF(5) számtesten tő — 1 — tf -- 4 mod 5, így a polinomosztás: 


























18. 3Ot? 7-Ott Ot? 01? 10144 — (12 4t41)(tt tt? 3 4t 44) 
—t5 —4t5 —1t8 
It? 4448 OL? -FOt? --0t --4 (-4z1 —154) 
—1tő —4tt — 1 
-HA? Ot? 1-0t 1-4 (—1 7 4) 
—4t? —1t? —4t (4-4—16—-1) 
-H4? -1t-H4 
—4t? —1t—4 
0 
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A sorok mellet zárójelben a felhasznált mod 5 műveletek láthatók. Tehát h(t) — 
44-44-81 É. 
A v vektorhoz rendelhető polinom 


v(d) —4-42436 4. 


A szindrómapolinom ennek a h(t) polinommal vett szorzata. A szorzás során 
figyelembe kell venni nem csak azt, hogy GF (5) számtest felett vagyunk, hanem 
azt is, hogy a ciklikus kódoknál minden polinomot modulo (t" — 1) kell értelmezni. 
A szorzás eredménye: 


v(t) ht) — (4-42t-43tt--t) : (4-4 4t 1-6? 1-1) — 
— 14t44t 4 4tta3te32 EV EVŐ 
- 2 1-2 43417 138 4 465 1 465 4 1-4? — 
— 1-44t43827148713tt1 36 4469 4 317 4 46? 319 mod 5 








Ennek a polinomnak kell a tf — 1 — t" 4-4 polinommal való osztása utáni maradékát 
venni: 


0? 7418 7-3t7 4416 --345 --3t --4t? 1312 -44t --1 — (tt? -- 4) (b? -- 462 31 4) 
1? —0t8 —OtT —0t6 —0t? —Ot? — 41? 


4t8 3-3t7 71-4t5 —-3t? 73-31 --Ot? 3-342 --4t 1 
4t8 —Ot" —0t5 —Ot? —0tt —0t? —142 


3t7 71-45 —-3t? 71-31 --Ot? 53-21? --4t --1 
317 —016 — Ot? —O0tt —O0t? —0t? —2t 


4t5 3-3t? 71-3t1 3-Ot? 73-21? 3-2t 7-1 
4t5 —Ot? —Ott —Ot? —0t2 —0t —1 


3? 1-3t1 3-0? 3-2t2 3-2t 1-0 



























































A szindrómapolinom tehát: s(t) — 2t -- 2t? 4 31! - 3tő, azaz v nem kódszó. 


10.2. Ciklikus kódok a gyakorlatban 


A szabványokban a ciklikus kódokat generátorpolinomjukkal szokták megad- 
ni. 

Azért szeretik a polinomos megadást, mert a polinomok szorzása és 
osztása áramkörökkel egyszerűen megoldható. A következő ábra azt mu- 
tatja, hogy egy p(t) — po 1 pit pot? - ...ppt? polinomnak a g(t) — 
d07-g1 geth. . . got?-nal vett szorzatát, s(t) — s0--s1--sot2-. . . spyotft?- 
t, illetve annak együtthatóit milyen áramkörrel tudjuk létrehozni. A három- 
szögek erősítők, vagy konstansszoros szorzók, a négyzetek tárolók, a körök 
1-jellel pedig összeadók. 
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Tegyük fel, hogy kezdetben minden tároló 0-n áll, majd adjuk 99-t az 
áramkörre. A kimeneten megjelenik pogo, az s(t) nulladrendű együtthatója. 
A következő lépésben az első tárolón 99 van, a bemeneten a1, a kimeneten 
dopi - g1po, ami pont s(t) elsőrendű együtthatója, és így tovább. Ha az u;-k 
elfogytak, 0-kat kell a bemenetre adni addig, amíg minden tároló újra ki 
nem ürül. 

A polinomok osztását az alábbi visszacsatolt léptetőregiszteres áram- 
körrel lehet megvalósítani: 


0—-T HOT 





Ha fokszám szerint csökkenő sorrendben beadjuk az osztani kívánt s(t) po- 
linom együtthatóit, akkor a kimeneten a g(t) — s(t)/p(t) hányadospolinom 
együtthatói jelennek meg, a tárolókban pedig a maradék. 

Ciklikus kódolásra és dekódolásra kész integrált áramkörök kaphatók 
különböző fokszámú generátorpolinomokkal. Mind a kódoláshoz, mind a 
paritásellenőrzéshez alkalmazhatók lineárisan előrecsatolt, illetve lineári- 
san visszacsatolt léptetőregiszterek. 


A műholdas műsorszórás során alkalmazott (32,12) paraméterű Golay- 
kód is ciklikus kód, generátorpolinomja 


90 —-4a071é1ér4éi-1 
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E kód minimális súlya 7, és maximálisan 3 egyszerű hibát tud javítani. 


Az úgynevezett CRC-kódok (Cyclic Redundancy Check) szintén cikli- 
kus kódok. Csak hibajelzésre alkalmasak, általában egy igen nagy méretű 
(tipikusan több ezres, több tízezres nagyságrendű elemszámú) blokkhoz 
egy viszonylag kicsi (néhány tíz elemből álló) paritásszegmenst tesznek. 
Mivel csak hibajelzésre alkalmasak, két fő felhasználási lehetőségük van. 
Alkalmazzák egy másik, hibajavító kóddal kombinálva, hogy annak bizton- 
ságát növeljék viszonylag kis kódsebesség csökkenés árán. Használják zajos 
visszacsatolt csatornákon való üzenetátvitel során is, ahol a hiba detektálá- 
sa után automatikusan az üzenet megismétlését kérik az adótól. A CRC- 
kódok alkalmasak hibacsomók detektálására, illetve ha a CRC-kódolás 
után egy hibajavító kódolást is elvégzünk, akkor az a hibás dekódolást is 
nagy valószínűséggel felfedi. 
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11. Reed-Solomon-kódok 


Legyen tosti, . . . tn-i a GF(N) véges test n ca N darab, különböző ele- 
me, továbbá b — (bo, bi, . . . bk-1) egy továbbítandó üzenet. Rendeljük az 
üzenethez a 


b(t) — bo 4 bit... beat"! (11.1) 

GF(N) feletti polinomot. A Reed-Solomon-kód a b üzenethez azt a c — 
(C0,C1, : : . .(n—1) kódszóvektort rendeli hozzá, amelynek c; komponenseit a 
Cj; — b(t) (11.2) 


képlet határozza meg. Látható, hogy a t; elemek kiválasztása adja meg a 
kódot. 





11.1. Példa: A GF(5) feletti Reed-Solomon-kódunk generáló elemei legye- 
nek a to — 1, t1 — 4, t2 — 3 és a ts — 2. Adjuk meg a b — (1 2 4) üzenetből 
kapott kódszót. 





Az üzenethez rendelhető polinom a b(t) — 1--2t--4t?. A kódoló ebbe a polinomba 
helyettesíti be rendre a to, t1, t2 és ti számokat, hogy megkapja az n — 4 elemű 
kódszó nulladik, első, második és harmadik komponensét: 








b(to) — 1-42:1-44-14—75-2mod5 (11.3) 
b(ta) — 142-4574-4—7353mod5 (11.4) 
b(t2) — 142-3544-37—43—-3mod5 (11.5) 
b(ta) — 1-742-2-44.-27—21—-1mod5 (11.6) 


A kapott kódszó tehát c — (23 3 1). 


A Reed-Solomon-kódok lineárisak, maximális távolságúak (MDS-ek). 


Bizonyítás: Azt szeretnénk belátni, hogy a Reed-Solomon-kódokra teljesül, 
hogy dmin — n— k 4 1. A (7.15) Singleton-korlát szerint 


dmin £n—k-l, 
így azt kell belátnunk, hogy a c - 0 kódszavakra igaz, hogy 
Et min w(c) 52n-k-1. 


Minden kódszó súlya a nem nulla komponenseinek a száma. A kódszavak 
komponenseit viszont úgy kaptuk, hogy a megfelelő t; számokat helyet- 
tesítettük be az üzenetpolinomba. A csupa nulla együtthatós polinom 
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kivételével a b(t;) eredménye csak akkor lesz 0, ha t; a b(t) polinom gyö- 
ke. Mivel az üzenet k komponensű, a hozzárendelt polinom legfeljebb 
k — 1-edfokú, egy k — 1-edfokú polinomnak viszont legfeljebb k — 1 gyöke 
van. Az n darab különböző t; számból tehát legfeljebb k — 1 adhat 0-t az 
üzenetpolinomba behelyettesítve, így a kódszónak legfeljebb k — 1 nulla 
komponense lesz, a maradék, legalább n — (k — 1), komponens nem lesz 0. 


Így 
w(0 3n—-ki1. 


(O.E.D.) 
Mivel a Reed-Solomon-kódok MD$-ek, n — k hiba jelzésére képesek, 
legfeljebb (n — k)/2 egyszerű és n — k törléses hibát tudnak javítani. 


11.1. A generátormátrix és a paritásellenőrző mátrix 


A GF(N) véges test feletti, to,t1, . . . tn-i generáló elemekkel rendelkező 
Reed-Solomon-kódok generátormátrixa 


1 1 0... 1 
to ti sze EAT 

G-[ 8 0 HÚ 0 -.. tü (11.7) 
kel skél ki 
to ti ... t-i 


11.2. Példa: Készítsük el a 11.1 példában megadott (4,3) paraméterű Reed- 
Solomon-kód generátormátrixát. A generátormátrix használatával adjuk 
meg a b — (1 2 4) üzenetből kapott kódszót. 
Mivel az üzenetszegmens hossza k — 3, a mátrix 3 soros lesz, és mivel n — 4, 
négy oszlopos. Ahhoz, hogy megadhassuk a G mátrixot, szükség van a to, ti, 
ta és tz3 elemek első két hatványára. A ta minden hatványa 1, a ti — 4 négyzete 
16 - 1 mod 5; a három második hatványa GF(5)-ben 4; a 2-é pedig szintén 4. A 
generátormátrix tehát a következő: 

1 

2 J. 

1) 


1 1 
G—Í 14 
1 1 


1 1 11 
b.G—(124)-[ 1 4 3 2 1—(2331) mod5. 
1 1 4 4 


1 
3 
4 


A kódszó 


Ez azonos a 11.1 példában kapott eredménnyel. 
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11.2. Egyetlen generálóelemmel definiált Reed-Solomon-kód 


Lássuk, hogyan érdemes a t; kódot meghatározó elemeket megválasztani. 
Legyen V e GF(N), nem nulla, és a rendje legyen legalább n. (Mivel 
n a N, a GF(N) egy primitíveleme mindig jó választás). Ekkor Ú9 — 
1.91 ,92, . . . 97! mind különböző GF(N) beli szám lesz, tehát a t; — 


választás jó. A 99 V1, . . . 977! Galois-testbeli elemek által generált Reed- 
Solomon-kód generátormátrixa 
1 1 1 szá 1 
1 Ú 42 stsi 9771 
G — 1 492 48 sség 42(n—1) j (11.8) 
1 9-1 92(k-D ..  g(n—D(k-D 


A kód paritásellenőrző mátrixa 


1 1 ata 1 
Ú 42 Bász 07-k 
ural 92 Út 7... 42(n-k) : (11.9) 
gn-I 92(n—1) VERA 9(n—1) (nk) 


A fenti konstrukció tulajdonképpen azt jelenti, hogy a (11.2) képlet 


eze (0) Mi 5 b; (o) (11.10) 
j—0 
alakra módosul. 


11.3. Példa: A GF(7) Galois-testnek a 3 hatodrendű eleme. Adjuk meg a 
Ú — 3 generálóelemű (6.4) paraméterű Reed-Solomon-kód t; generálóit. 
Számoljuk ki a b(t) — 1 -- 5t -- 4t? üzenetpolinomból létrehozott kódszót. 
A 3 első hat hatványa különböző lesz, mivel a 3 hatodrendű elem GF(7)9-ben. Így 
a kódot generáló hat szám: 

to — 49 — 39 —1 

th — 0 — 37 —3 

ta — 0? — 37— 9-2 modr 

tsz — 97 — 37 — 27-6 mod7 

ta — 01 — 3! — 81—4 mod7 

ts — 97 — 37 — 243—5 mod7 
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A b(t) üzenetpolinomba behelyettesítve ezeket a számokat megkapjuk a kódszót: 








b(v9) — 1345-1-44-19—10—3 mod7, 
b(v9) — 1345.-3-44.-39—124—5 mod7, 
b(49) — 1-45.-244-22—43—1 modT7, 
b(49) — 1-45.-6-44-63—895—6 modT7, 
b(49) — 1-45-444-49—277—-4 modrT, 
b(49) — 1-45.-5-44.-59—526—1 mod7, 


ígyc— (351641). 


11.4. Példa: Készítsük el a 11.3 példabeli Reed-Solomon-kód generátormát- 
rixát és paritásellenőrző mátrixát. 


A generátormátrix a (11.8) képlet szerint: 


FEE E 
03 B 6 E 
FK HAH E 
9 EG E 
FA B 
0 A OT E 











Itt felhasználtuk a következő moduló 7 ekvivalenciákat: 9 — 2, 27 — 6, 8 1, 
36—-1,216—-616—264—-1,25 —4és 125 — 6. 

A paritásmátrix a (11.9) képlet alapján, mivel n — k — 6 — 4 — 2, két oszlopos 
és n — 6 soros lesz: 











(11.11) 


HORN WE 
VE HE 


UL 
HA 


Leellenőrizhetjük, hogy a két mátrix szorzata GF(7)-ben egy 4 soros, 2 oszlopos 
nullmátrix. 


11.3. A Reed-Solomon-kód, mint ciklikus kód 


Rendeljünk minden c — (cg,c1, . . . n—1) kódszavunkhoz egy 


n—-1 
c(t) s gt ejt-r cost? t...-K en at — pa Ci: tv 
1-0 
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polinomot. Helyettesítsük be a kapott kódszópolinomba a 9 generáló elem 
első n — k hatványát, az elsőtől kezdve: 


c (4) — 9 : (9y 


Ha behelyettesítjük a c; együtthatók (11.10) definíciós összefüggését, az 
előbbi egyenlőség a következő alakot ölti: 


n—1 / k—1 ; n—-1k—1 
c(0)—-y ! u) (a) ez yb, (11.12) 
1—0 447—0 1—0 j—0 

Mivel a j index 0 és k — 1 között van, / pedig 1 és n — k között, a j -- l-re 
mindenképpen igaz lesz, hogy 1 £ j-41l £ n— 1. Eszerint, mivel Ú-nak 
csak a nulladik és az n-edik hatványa lehet 1, a 411! £ 1. a (11.12) így a 
következő alakúra írható át: 

k—1 n—-1 i 

9-5 ie), 

j—0 1-0 
ahol a nagy zárójelben szereplő kifejezés tulajdonképpen egy mértani sor 
első n elemének az összege, csak a mértani sor GF(N)-en van értelmezve. A 
mértani sor n-edik részösszegének a képlete véges számtesteken is érvényes 
(feltéve, hogy a sor kvóciense nem 1), így 


fizsi ; (0G69DY 1 
pa (904) - ( ) 
ú Ú4G3D-1 7 
1-0 
ami nullát ad eredményül, mivel V" — 1. Visszahelyettesítve az eredményt 
(11.12)-be, a Reed-Solomon-kód paritásegyenleteit kapjuk: 


c(0)-0 — halsiSn-k. (11.13) 


A paritásegyenletek szerint a Ú generátorelem első n — k hatványa minden 
kódszópolinomnak a gyöke. 
Így létezik egy olyan polinom, amely minden kódszónak osztója: az a 
polinom, melynek a gyöktényezői a (t — 99-ek, I — 1.2, . . . n — k-ra. 
A szóban forgó Reed-Solomon-kód tehát egyben egy a GF(N) véges 
test feletti (n,k) paraméterű ciklikus kód is, melynek a generátorpolinomja 
(gyöktényezős felbontásban) 


sg sit edj me esse, 
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Belátható, hogy a t" — 1 polinomnak az összes (t — 4") polinom a osztója, 
így a kód paritásellenőrző polinomja előáll 


n—-1 


1"-1-][[(1—-0) 


1—0 
polinom 9(t)-ben fel nem használt gyöktényezőkből, azaz 


h(t) — (t — 997t) . (1 — 9972)... (t— 09). 


11.5. Példa: Adjuk meg a 11.3 példában szereplő GF(7) feletti, (6,4) para- 
méterű Reed-Solomon-kód generátorpolinomját és paritásellenőrző poli- 
nomját. 
A kódot generáló V — 3 szám első 6 hatványa 3, 2, 6, 4, 5 és 1 voltak. A ge- 
nerátorpolinom a Ú — 3 generáló elem első n — k — 2 hatványát tartalmazza 
gyöktényezőként: 

9(t) — (t— 3) : (t — 2). 


A 3 további négy darab hatványa a paritásellenőrző polinomot alkotja: 





h(t) —(t—6) - (t— 4) - (t— 5) - (t— 1). 


A különböző szabványokban a Reed-Solomon-kódoknak is a generá- 
torpolinomját szokták megadri, többnyire gyöktényezős alakban. 


11.4. Reed-Solomon-kódok nem prím elemszámú véges teste- 
ken 


2 ze 


Matematikai kitérő — A nem prím elemszámú véges testekről. Igen 
érdekes következménye a polinom-Galois-testek létezésének az, hogy 
az egész számok körében lehet GF(NY) típusú véges testeket is defini- 
álni, azaz nemcsak prím elemszámú, hanem egy prím egész hatványaival 
megegyező elemszámú Galois-testeket is létre lehet hozni. A gyakorlatban 
a számítástechnikában a bit egységen kívül a bájt is használatos, ami 
2 egész hatványa (25), így a véges testeknek ez az általánosítása igen 
hasznos. 

Egy (0.1, . . . NM — 1) halmazhoz tudunk úgy összeadást és szorzást 
definiálni, hogy véges testet alkosson. Minden p € (0.1, . . . NM — 1) 
elemhez rendeljünk hozzá egy-egyértelműen egy p(t) GF(N) felet- 
ti, legfeljebb M — 1-edfokú polinomot. Ha a p € (0,1,... NM — 1) 
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számokat úgy adjuk és szorozzuk össze, mint a hozzájuk rendelt 
polinomokat, akkor (0.1, . . . NM — 1) — GF(NM), véges test, vagy 
Galois-test lesz. Ez a hozzárendelés egy-egyértelmű megfeleltetést je- 
lent GF(NM) és GF(P(t)) között, ha P(t) GF(N)-nek egy M-edfokú 
irreducíbilis polinomja. 

Például a GF(25) testhez lehet P(t) — t? 1-tt 48? 112 4 1. Az egyes 
p e GF(29) elemekhez a következőképen rendelhetjük a GF(t£? -- t! 
tt? --19-beli polinomokat: Vegyük p kettes számrendszerbeli alakját 


p— pg: 234 pz:274...-4 po : 9. 
A p-hez rendelt p(t) polinom kézenfekvő módon a 
p($) — pe -Papy:t 4... po: t. (11.14) 
11.6. példa: Készítsük el a GF(2?) — GF(4) véges testet. 

Megoldás: Ha a (11.14) hozzárendelési szabályhoz hasonlót használunk, 
akkor a 0, 1, 2 és 3 számokhoz a következő polinomok fognak tartozni (az 
egyenlőségjel után a számok bináris alakja található): 

0—-00 8 0t-€0 

1—01 $€ 0t-41 


2-10 S 1t€40 
3—-11 § 1t141 





Ezek pont a 10.4. példában szereplő polinomok, így tudjuk a szorzó- és össze- 
adótáblájukat. Behelyettesítve a 10.4. példa táblázataiba a polinomoknak 
megfelelő számokat, a következő összeadó, illetve szorzótáblát kapjuk: 
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Eszerint például 1 -- 3 — 2, vagy 2 : 3 — 1, ami eléggé ellentmond a hagyo- 
mányos elképzeléseknek, de még a GF(N) típusú Galois-testekből örökölt 
elképzeléseinknek is. 


Természetesen nem csak a (11.14) hozzárendelési szabály alkalmazha- 
tó, a lényeg az, hogy egy-egyértelmű szabály legyen. 
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A nem prím elemszámú véges testeken is lehet hatványozást értel- 
mezni, a sima GF(N) esethez hasonlóan: Egy t c GF(NM) elem 
hatványait önmagával vett szorzatainak egymásutánjaként értelmez- 
hetjük, azaz ha ismert t! — t, akkor 


bei! et (11.15) 


A szorzás természetesen a véges test szorzótáblájának megfelelően 
történik. A t - 0 elem rendjének itt is azt a legkisebb o - 0 egész 
számot értjük, amelyre 

1-1. 


Az egységelem rendje 1, a nullelemnek továbbra sincsen rendje. 
11.7. példa: Adjuk meg a GF(4) véges test elemeinek a hatványait és az 
elemek rendjét. Használjuk a 11.6 példa szorzótábláját. 


Megoldás: Az 1 elem minden hatványa 1, rendje így 1 lesz. A 2 szám első 
hatványa 2, a második a szorzótábla szerint 


22—2.2— 3, 


a harmadik pedig 
22—22.2—3.2—1. 


A 2 tehát harmadrendű elem GF(4)-ben. A 3 hatványai: 








31 — 3 
37 — 3.3—2 
37 — 32.3—2.3—1, 


tehát a 3 is harmadrendű. 


A hatványozás ismeretében a GF(NV ) feletti polinomok definiálása 
egyértelmű. A polinomok összeadásánál és szorzásánál az együttható- 
kon végzett műveletek esetén a véges test összeadó- és szorzótábláját 
kell használni, nem a GF(N) műveleteket. 


Egy 9 c GF(NM) n-edrendű elemmel lehet Reed-Solomon-kódokat defini- 
álni nem prím elemszámú véges testekre is, hasonlóan a prím elemszámú 
véges testekhez. Az összes korábban felírt állítás igaz marad, azzal a kité- 
tellel, hogy az összeadás és a szorzás nem modulo N művelet lesz, hanem 
a GF(NY) test összeadó-, illetve szorzótáblájának megfelelően kell őket 
elvégezni. 
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12. A Reed-Solomon-kódok spektruma és dekódo- 
lása 


12.1. A Reed-Solomon-kódok spektruma 


Matematikai kitérő - A véges testeken értelmezett Fourier- 
transzformációról és a ciklikus konvolúcióról. A spektrum kiszá- 
molásához szükség van a Fourier-transzformációnak az n darab 
GF(NM)-beli elemből álló c vektorokra való kiterjesztésére. A Fourier- 
transzformálás eredménye egy szintén n elemű C vektor, amely szin- 
tén a GF(NM) test elemeiből épül fel. 

Egy (co,ci, . . . cn-1) komponensű c e GF(NM)" vektor Fourier- 
transzformáltja egy olyan C—(Co,C1, . . . ,n-—1) vektor, melyre 


n-1 
Cy — 9 eV, (12.1) 
1-0 


ha 9 a GF(NM) véges test n-edrendű eleme. (Azaz, ha Ú7 — 1.) A 
C vektor a c-nek a spektruma. A c Fourier-transzformáltját szokás 
F(fc)j-ként írni. 


A véges testeken értelmezett Fourier-transzformáció is invertálható, 
azaz a C ismeretében c egyértelműen megadható, méghozzá a 


n—-1 
c; — f(n) XCV? (12.2) 
j—0 


formulával, ahol az f(n) szám az n-nek a véges testen belüli (moduló 
N) inverzét jelöli. Ha N — 2, akkor természetesen f(N) — 1. 


Legyen két, egyenként n darab GF(NM)-beli elemből álló vektorunk, t 


vektort értjük, amelynek komponensei az 


n—-1 


sz — f(n) X tk) mod n" Uk (12.3) 
k—0 


képlettel állíthatók elő. A ciklikus konvolúció jelölése hasonló a ha- 
gyományos, nem véges testeken vett konvolúcióéhoz: s — t £ u. 


A véges testeken is érvényes a konvolúciós tétel, amely a következőt 
állítja: Legyen s, t, u c GF(NM)" vektorok spektruma rendre S, T és 
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U. Ha a vektorok komponenseire fennáll, hogy 

özön (12.4) 
akkor a spektrumaik között az 

$-TxU (12.5) 


összefüggés lesz érvényben. 
Bizonyítás: Az s a Fourier-transzformáltja a (12.1) definíció szerint: 


n—-1 


5; - Y. s197 — 


1—0 
a (12.4) képletet behelyettesítve 


n—-1 s. 
— 9 ti ui" — 
1-0 


n—-1 n—1 
- tis [7 PB gi) vii 
1-0 


k—0 
n—-1 n—-1 He; 
- mo SZo (Soó, 
k—0 1-0 


Az utolsó sorban a nagy zárójelben szereplő kifejezés lényegében t 
Fourier-transzformáltjának (j — k)-adik komponense. Természetesen 
előfordulhat, hogy j — k — 0, ekkor helyette az n-nel adott maradékát 
kell használni, (j — k) mod n-t. (O.E.D.) 


12.1.1. A spektrum jellemzői 


Ahogy a c € K kódszóvektorhoz lehetett rendelni polinomot, a Ffcj — 
C — (Co, C1, . . . Cn-1) spektrumához is lehet egy polinomot rendelni a 


C() — Cor C1-t4C2Br...FOna ET (12.6) 


képlettel. A C(t) polinomot a c(t)-hez rendelt spektrumpolinomnak ne- 
vezzük. 

Legyen a Reed-Solomon-kódunk generátorpolinomja 9(t), a kódolni 
kívánt tömörített üzenetünk b — (bo,bi, . . . bk—1), a hozzá rendelt polinom 
b(t) — bo 3 b-t... .4bk.atf7!. Vegyük észre, hogy ha a c(t) polinomjaink 


Tartalom ] Tárgymutató sz sp allzb 


Információelmélet A Reed-Solomon-kódok spektruma 
Tartalom ] Tárgymutató . 8 a1136b 





(n — 1)-edfokúak, s ezért az (n — 1)-edfokú polinomok között szeretnénk 
dolgozni. A b(t) együtthatói, ha b(t)-t n — 1-edfokú polinomként kezeljük, 
a következők lesznek: 0-tól (k — 1)-ig a b vektor komponensei, k-tól (n — 1)-ig 
pedig csupa 0. 

A c(t) kódszópolinom a 9(t) : b(t) képlettel állítható elő. Vizsgáljuk 
meg a polinomszorzás (10.3) definíciójában szereplő együtthatókat. Ezt 
alkalmazva a c(t) együtthatóira 


n—-1 
EE E ifj 
j—0 


544 


meg. 
A 9(t) generátorpolinomú Reed-Solomon-kóddal a b üzenetből létre- 
hozott c kódszó tehát 
c—g:b. 


A kódszó spektrumára ekkor a konvolúciós tétel szerint igaz, hogy 
Cj — Gj : Bi, 
ha B; az üzenet Fourier-transzformáltjának j-edik komponense. 


A c(t) polinomnak akkor és csak akkor lehet gyöke ú7, ha a C(t) spekt- 
rumpolinomban az 7-edik együttható: 


C;-0 (12.7) 


Bizonyítás: Ez az állítás könnyen belátható, hiszen ha 9 a Fourier- 
transzformálásban használt n-edrendű GF(NM)-beli elem, akkor 


n—-1 
e(di) — eg - eri 4 ez? -k . . . 4 en 1987 — Veit, 
j—0 


ami az (12.1) definíció szerint pont C;. A c(t)-nek pedig akkor gyöke 9, ha 
c(V") — 0. (O.E.D.) 
Az állítás fordítva is igaz, a C(t) spektrumpolinomnak akkor és csak 
akkor gyöke 07, ha c; — 0. 
Legyen a Reed-Solomon-kód generátorpolinomjának gyöktényezős 
felbontása 
9(t) — (t—09)(t — 92) - . . . - (t— 977), 
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Mivel 9! gyöke g(t)-nek i — 1.2, . . . n — k-ra, a (12.7) szerint azt eredmé- 
nyezi, hogy 
C; — 0, 1—1,2,... n — k-ra. 


Az (n,k) paraméterű Reed-Solomon-kódszavak spektrumának első n — k 
komponense nulla. 

Ez a tény lehetőséget biztosít a Reed-Solomon-kódok spektrumukon ke- 
resztül való generálására. Ha ugyanis a C kódszóspektrum 0-tól (n — k)-ig 
terjedő komponenseit nullára választjuk, a maradék k helyre pedig betölt- 
jük az üzenetet, majd C-t inverz Fourier-transzformáljuk, akkor biztos, 
hogy jó kódszót fogunk kapni. 


12.1. Példa: Számítsuk ki a 11.3 példában szereplő GF(7) feletti, (6.4) pa- 
raméterű Reed-Solomon-kód által generált c — (3 5 1 6 4 1) kódszó 
spektrumát. (A Fourier-transzformációban szereplő 9 szám azonos a kódot 
generáló Ú — 3-mal.) 

Alkalmazzuk a Fourier-transzformáció (12.1) definíciós összefüggését, figyelembe 
véve, hogy 9 — 1, 41! — 3, 92 — 2, 99 — 6, Vt — 4 és 95 — 5: 























Ca — 3.145.-1-41.-1236-1944.1131-17—20—6 mod7, 

Ci, — 3.145.341.-3236.3944.31-31.39—756—0 modr, 
C2; — 3.135.2341.-2216.2934.2141.-29—161—0 modrT, 
Cs; — 3.145.6-41.6236.6944.6t--1.6" —14325—3 mod7, 
Ca, — 3.145.441.-4236.-4944.4t31.-49—2471—0 mod7, 
Cs — 3.1345.541.5236.5944.5t41.57—6428—2 mod7. 


A spektrum tehát C — (6 0 0 3 0 2), ahol a Ci és C2 komponensek valóban nullák. 


12.2. A Reed-Solomon-kódok dekódolása 


Legyen a vett vektorunk v — (vo,v1, . . . Vn—1), és tegyük fel, hogy egy 
c — (cg,C1, : . . .Xn-1) kódszóból keletkezett, Ac — (Acg,Ac1, . . . ,Acn—1) 
hibavektor hozzáadásával. Emlékeztetőül: a Reed-Solomon-kódok paritás- 
ellenőrző mátrixa a (11.9) szerint: 


1 1 javas 1 
Ú 42 Biza 077 
HI —] ú Út... 9 ; 
9-1 92(n—1) ert 9(n—1) (nk) 
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ahol 9 a kód generáló eleme. Minden lineáris blokk-kódra igaz, hogy 
a szindróma a vett vektornak csak a hiba-részéből keletkezik, hiszen az 
érvényes kódszavak szindrómája 0, azaz: 


s(— v HT) — Ac. HT. 


Ennek az egyenletnek a megoldása a hibavektor, amellyel ki tudjuk javítani 
a vett vektorunkat. Ha elvégezzük ezt a mátrixszorzást, akkor a szindróma 
J-edik elemére a következő képletet kapjuk: 


n—-1 
sj— Y Ac: 07 (12.8) 
2-0 


12.3. Törléses hibák javítása 


Ha ismerjük a hibák helyét, azaz törléses hibákról beszélünk, akkor legfel- 
jebb n — k hibát tudunk kijavítani egy (n,k) paraméterű Reed-Solomon- 
kóddal. Ez azt jelenti, hogy a Ac hibavektornak legfeljebb n — k kompo- 
nense lesz 0, és azt is tudjuk, hogy melyek ezek a komponensek, csak a 
nagyságukat nem ismerjük. 

Tegyük fel, hogy pontosan n — k törléses hibánk van. (Ha ennél ke- 
vesebb, akkor néhány helyen nulla lesz a törléses hiba nagysága.) Így a 
(12.83) egyenlőségek mindegyikében csak jól meghatározott n — k darab tag 
adhat nem nulla eredményt az összegben. Tulajdonképpen a H" mátrix- 
nak csak bizonyos sorai vesznek részt a műveletekben, mivel ha Ac; — 0, 
akkor a H! mátrix i-edik sorában minden elemnek nulla lesz a szorzója 
a (12.8) egyenletek mindegyikében. Töröljük gondolatban ezeket a sorokat 
a mátrixból, így kapunk egy csonkolt HT mátrixot, amelynek n — k sora (és 
ugyanannyi oszlopa) van. Töröljük a hibavektorból is a nulla elemeket, így 
AC vektort kapunk n — k komponenssel. Mivel a szindróma n — k elemből 
áll, egy n — k darab egyenletből álló egyenletrendszert kapunk A€-re, ami 
teljesen meghatározza Ac-t, azaz a 








Hoo : A€g 4 Hi0 : Aőr 4.4 Hh-kr10" AŐnekei — 50 
Hoi: ACo 3 Hi11: A€1 3... Hn-k—11" ACn-kh1 — 51 
Hon kar Ag FF Hi nekarAőr rk... Heka nk AŐnki — Sn-kA 


egyenletrendszer egyértelműen megoldható. 
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Az, hogy egy n — k egyenletből álló egyenletrendszernek van-e egyér- 
telmű megoldása, attól függ, hogy az egyenletrendszert meghatározó mát- 
rix milyen. Ha a mátrixnak nincs tiszta 0 sora, sem oszlopa és egyik so- 
ra(oszlopa) sem áll elő másik sorok(oszlopok) lineáris kombinációjaként, 
akkor az egyenletrendszer megoldható. 


12.2. Példa: Tegyük fel, hogy a 11.3 példában keletkezett kódszó a második 
és a negyedik helyen meghibásodott a csatornán való áthaladás során, így 
av — (35465 1) vektort vettük. Dekódoljuk a vektort a 11.11 paritáselle- 
nőrző mátrix segítségével. 


Számoljuk ki a vektor szindrómáját: 


s—v.HT-(3 5 4 6 5 1). — (87 49E(3 0) mod7. 


OH OP WE 
DE HAIR E 


4 


A hiba a 2. és a 4. pozícióban van, így a csonkolt paritásellenőrző mátrix a követ- 
kező (a sorok számozása nullánál kezdődik) 


sg fa 
Mözt TS Ji 


E mátrixnak a csonkolt Ac — (Ac2 Ac4) hibavektorral vett szorzata megadja a 
szindrómát: 

2-Ac2tF4-Aci — 

4:.Acs 42: Aca 





A második egyenlőségből kifejezve Ac2-t, felhasználva, hogy —4 — 3 mod 7 és 
3! zs5modT: 
c —2:5c4 — 3c4 mod 7. 


Az első egyenlet szerint 
(6 -- 4)ca — 3c4 — 3, 


így ca — lés cz — 3, tehát a második helyen a hiba 3, a negyediken 1. A javított 
kódszó vjav — (3 5 1 6 4 1), ami a kiindulási c-vel megegyezik. 


12.4. Egyszerű hibák javítása 


Ha az egyszerű hibák száma v, akkor a Ac vektornak n — v komponense 
0 lesz, v darab pedig nem nulla. A probléma csak az, hogy nem tudjuk, 
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melyik helyeken vannak a nem nulla Ac; elemek, és azt sem tudjuk, azok 
mekkorák. 

Tegyük fel, hogy az 1-edik helyen van hiba. Ekkor a (12.8) egyenletek 
mindegyikében az összegekben szerepel egy 


Aci a (9 


típusú tag, ahol j az egyenlet sorszáma. A Ú! mennyiségből egyértelműen 

ki lehet számítani a hiba helyét, hiszen 0 minden n-nél kisebb hatványa 

különböző, ezért a 9! mennyiséget hibahely lokátornak nevezik. 
Vezessünk be egy hibahelypolinomot: 


v 
LD —-1[(141—97-2—1-6 £1t-- La... Lt, (12.9) 
2-1 


ahol a l; index jelöli azokat a pozíciókat, ahol hiba van. Ezeket a pozíciókat 
természetesen nem ismerjük. Figyeljük meg, hogy az L(t) polinomnak a 
gyökei pont a hibahely lokátorok inverzei. Ha tehát meg tudjuk határozni 
az L(t) polinomot, akkor ki tudjuk számolni azt, hogy melyik pozíciókban 
van hiba úgy, hogy 


e megkeressük a polinom gyökeit, 
e invertáljuk azokat a megfelelő véges test felett, 


e majd az inverzről kiderítjük, hogy 9-nak hányadik hatványa. 


A V! szám inverze az L(t) polinom gyöke, azaz 
tív ed 


Szorozzuk meg az egyenlet mindkét oldalát Ac; - (0) ü -vel, így a követ- 
kező egyenletet kapjuk: 


Aa (VI (070) — 0. 


Összegezzük a fenti kifejezéseket Il — 1,2, . . . v-re, így az egyenlőség a 


Aa (9) L (7-0 (12.10) 
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alakú lesz. Ez az egyenlet minden j-re igaz. Fejtsük ki az L (07) polino- 
mot: 


L(97) —1-4L1:-414L- 0 esselsi (970) 


Helyettesítsük be ezt a felírást a (12.10) egyenletbe. vegyük figyelembe azt, 


hogy a polinom minden tagja meg van szorozva (0 7 as a 
syap a] 8 ey 


S7Acr (12 eze (OT De (097) — 0. 
1-1 


egyenlőséget fogjuk kapni, minden j-re. Összegezzük a kifejezést tagon- 
ként és emeljük ki minden tagból az L(t) polinom együtthatóját: 


Vágó) "zúsó aló "eszi ágió sú 
1-1 1-1 1-1 


Hasonlítsuk össze az egyes összegeket a (12.8) egyenlettel. Vegyük észre 
azt, hogy minden összeg egy-egy szindrómakomponerns, így az előbbi 
egyenlet felírható, mint 


Svaj TT La : Svrj—1 TF L2 : Szá jdr TT L, : Sj — 0, (12.11) 


aj — 0,1,2,...v — 1 indexekre. Kaptunk tehát v darab egyenletből álló 
egyenletrendszert a v darab L; együtthatóra. (Belátható, hogy az egyenlet- 
rendszer megoldható.) 

Az egyenletrendszerben a legnagyobb előforduló szindróma-index 
j — v— 1 esetén az első tag j 3 v — 2v — 1 indexe. Mivel az (n,k) pa- 
raméterű lineáris blokk-kódokkal legfeljebb v — (n — k)/2 egyszerű hibát 
lehet kijavítani, ez a maximális index nem haladja meg a szindróma kom- 
ponenseinek n — k számát. 

A (12.11) egyenletrendszer megoldásával megkapjuk a hiba- 
helypolinomot, amelynek meg tudjuk keresni a gyökeit, és ki 
tudjuk számolni belőlük a hibák helyét. Ha a hibahelyek ismer- 
tek, visszaértünk a törléses hibák javításának problémájához. 
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12.3. Példa: A GF(11) véges számtest feletti Reed-Solomon-kód paritásel- 
lenőrző mátrixa 


3 Naa ERNEK ERR ! 

tű Z7 3 

5 3 4 9 

mm 4 9 3 

T 3 9 5 4 
dj 10 1 10 1 
4 5 9 3 

6 3 7 9 

9 4 3 5 

8 9 6 4 


(Ez a GF(11) feletti, 0 — 7 generálóelemű, (6,10) paraméterű R-S-kód 
paritásellenőrző mátrixa.) Dekódoljukav — (831953 700 8) vett 
vektort. 

A kóddal legfeljebb v — 2 egyszerű hiba javítható. A vektor szindrómája: 


WD OAI E 
OTTO HO E 


s—v-H" — 831953 70 0 8). 


o 

KO HA WU FO A WWW OTF 
emet 
o 

HA UT CO W FH UT CO WE 


(0 olllta lenin 
9WaA oO 


— (189 217 256 147)—-(2 8 3 4) mod1lIl. 
A hibahelypolinom feltételezett alakja: 
I(t$) —1-4 Li1t4 LV. 


A szindróma komponenseit felhasználva felírthatjuk a hibahelypolinom együttha- 
tóira a 12.11 egyenletrendszert j — 0-ra és j — 1-re: 

S2-4 Li :Ss1-6 L2: 50 e 31 8L1 -2L2—0 

s3§ Li : 524 L2:s1i - 4 -- 3£L1 34 8L2 —0 














A második egyenletből fejezzük ki L2-t: mivel —8 — 3 mod 11, és 3-1 —4mod1lI, 


D2—-4.-444.3L1—5-41L1 mod11, 
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ami behelyettesítve az első egyenletbe 
0 — 3-4 8L1 7 2(5 4 L1) - 23 10L1 mod 11. 


A 10 ellentettje 1 a GF(11)-ben (11 — 10 — 1), így L1 — 2. Ebből L2 — 542 — 
7 mod 11. A hibahelypolinom tehát: 


I($) — Tt? 3-2t-1. 


A polinom gyökeit meghatározhatjuk próbálgatással: az 1 behelyettesítésével 10-et 
kapunk, tehát az 1 nem gyök. A 2 behelyettesítésével 33-at kapunk (ami — 0 mod 
11), így a hibahelypolinom egyik gyöke a 2. A másik gyök meghatározható az 
L(t)/(t — 2) polinomosztással vagy a további számok behelyettesítésével. A másik 
gyök a 4. 

A hibahely lokátorokat a hibahelypolinom gyökeinek inverzeként kapjuk meg: 


úi —- 2-!—-6mod11l 

Ú2 —- 4-7!—-3mod1I. 
Az utolsó lépésként meg kell keresni, hogy a / — 7-nek hányadik hatványa a 
6, illetve a 3. A 7 hatványai a nulladiktól kezdve a HT mátrix első oszlopában 


láthatók (emlékezzünk a mátrix (11.9) definíciójára). Ezek szerint 


47 - 6 
út — 3, 


a hibák tehát a 4. és 7. helyen fordulhatnak elő. 
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13. Hibacsomók elleni védekezés 


Egy csatornán nem csak elszórtan jelentkeznek hibák, előfordul, hogy egy 
egész sor egymás után következő szimbólum elromlik a csatornán való át- 
haladás során, például megkarcolódik a CD felülete. A sok egymást követő 
hibás szimbólumot szokás hibacsomónak nevezni. Mivel egymás utáni 
hosszú hibasorokat csak nehezen, igen hosszú paritásszegmensekkel lehet- 
ne javítani, vagy még úgy sem, ezeket a hibacsomókat célszerű valahogy 
szétbontani. Ha a kódolás során tehát szétválasztják a szimbólumsorozatot, 
hogy majd a csatornán való áthaladás után újra összefésüljék, akkor ha volt 
is a csatornán való áthaladáskor hibacsomó, az szétosztódik. A hibacsomók 
elleni védekezést kódátfűzésnek, vagy angol szóval , interleaving"-nek 
nevezik. 


13.1. Többutas kódátfűzés 


E módszer használatakor több párhuzamos szálon kódolják a b1,ba, . . . üze- 
netet, több kódoló berendezést alkalmaznak. Legyen összesen A águnk, A 
nem feltétlenül azonos csatornakódoló eljárással. A tömörített (forráskó- 
dolt) üzenet első szimbólumát az első ágra vezetjük, másodikat a második- 
ra, és így tovább a A-adikat a A-adikra, a A -- 1-ediket megint az elsőre. Az 
i-edik ágon tehát a b; b; A b:-2A; : . . :4(k—1)a üzenetet kódoljuk. Ezután 
az egyes ágakon keletkezett kódszavakat összefésüljük, és úgy engedjük 
a csatornára. A csatorna bemenetén tehát először az első ág kódszavának 
első szimbóluma jelenik meg, majd a második ág első szimbóluma, és így 
tovább. Az első ág második szimbólumát csak az utolsó ág első szimbó- 
luma után adjuk le. Vétel után szintén szétválogatjuk a szimbólumokat A 
ágra, A darab dekódoló berendezésre vezetjük őket, majd újra összefésüljük 
őket. 

A többutas interleavinghez A darab kódoló-dekódoló pár szükséges, 
azonban azok lehetnek lassú berendezések is (bonyolultabb kódolási algo- 
ritmusokkal), hiszen csak minden A-adik szimbólummal kell elbánniuk, 
elég az órajel frekvenciájának A-adrészén működniük. 

A hibacsomót így egy-egy kódszóban A-adrészére csökkenthetjük. 


13.2. Blokkos kódátfűzés 


Ez a módszer nem igényel több kódoló-dekódoló párt, viszont több tároló 
szükséges hozzá. Először a kívánt csatornakóddal kódoljuk az információ- 
folyamunkat, majd az így kapott szimbólumokkal (például) oszloponként 
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feltöltünk egy D x D méretű mátrixot. Amikor a mátrix tele van, elkezd- 
jük kiolvasni soronként, és így adjuk a csatornára. A csatorna kimenetén 
a D x D-s mátrixot soronként töltjük fel, majd ha betelt, oszloponként 
olvassuk ki. A kapott szimbólumsorozatot ezután dekódoljuk. 

Itt egy-egy kódszóban a hibacsomónak csak a D-edrészére jelenik meg. 

Hátránya ennek a módszernek, hogy egy-egy mátrix feltöltésére D? 
időegységet várni kell. Úgy szokták javítani a módszer időfelhasználását, 
hogy amíg egy mátrixot töltenek, az előzőt éppen kiolvassák. 


13.3. A digitális hangrögzítésben alkalmazott kódolások és kó- 
dátfűzés elve 


A CD-k kódolásakor egyfajta blokkos interleavinget használnak. Az egyes 
hangcsatornák jeleit 44,1 kHz frekvenciával mintavételezik és két bájtba 
kvantálják. Vizsgáljuk most csak a két hangcsatornás (jobb és bal) sztereó 
rendszert. Legyen a jobb csatorna mintavételezett, kvantált jele az i-edik 
időegységben 251 ,xi2 (első és második bájt), a bal oldalé yi ,y:2. Mind xzi és 
T2, mind pedig vi és y2 a GF(25) véges test eleme, hiszen bájtokról van 
szó. A két hangcsatorna két-két szimbólumsorozatát úgy fésüljük össze 
egy adatfolyammá, hogy először a jobb csatorna első bájtjait vesszük, majd 
a bal csatornáét, eztán a jobb csatorna második bájtjait, majd a balét és így 
tovább, végül az adatfolyamunk T11, T12, U11, 12, 121, 22, 21, 22, T31, 132, 
Y31, 32, : . - lesz. 

A feltöltendő mátrix 28 x 28-as, melynek a bal felső 24 x 24-es blokkját 
töltjük fel az adatokkal oszlopfolytonosan. Minden oszlopot (28,24) para- 
méterű G F(25) feletti Reed-Solomon-kóddal kódolunk, így tele lesz az első 
24 oszlop. Ezután minden sort is kódolunk ugyanezzel a kóddal, így tele 
lesz a mátrix. Ezt a mátrixot olvassák ki soronként, és így rögzítik a CD-re. 

Az alkalmazott Reed-Solomon-kód kódtávolsága 5, így 4 hibát tud 
jelezni, 4 törléses és 2 egyszerű hibát tud javítani. A dekódolás során 
azonban nem használják ki maximálisan ezeket a lehetőségeket. 


e Első lépésként a beolvasott mátrix minden sorának kiszámolják a szind- 
rómáját. Ha 0 a szindróma, a sort békén hagyják. Ha egyetlen egyszerű 
hibát detektáltak, azt kijavítják, ha kettőt, akkor azok helyére törléses 
hibákat tesznek, ha pedig 2-nél több hibát detektáltak, az egész sort 
törléses hibákkal helyettesítik. 


e Ezután megvizsgálják oszloponként a mátrixot. Ha az adott oszlopban 
legfeljebb két törléses hiba van, azokat kijavítják (nem mind a 4 javít- 
ható törléses hibát). Ha ennél több törléses hiba van, azok helyén a jel 
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értékét a környező hibátlan szimbólumok felhasználásával közelítik. 


Azért nem használják ki a kódból eredő összes javítási lehetőséget, mert 
gyors dekódoló algoritmusra van szükség, és a közelítés gyors, és — mivel a 
mintavételezett jel viszonylag folytonos volt, az emberi fül pedig elég nagy 
tehetetlenségű - elég pontos is. 
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14. Konvolúciós kódolás 


A konvolúciós kódolás egészen más módszereket használ, mint a blokk- 
kódolás. 

Konvolúciós kódolás során forrásból származó, már tömörített 
b1,b2,b3, . .. bitsorozatot k bites szakaszokra, üzenetszegmensekre bont- 
juk. A kódolóban mindig m darab üzenetszegmens tárolódik. Egy tárolt 
k-bites üzenetszegmenst keretnek vagy üzenetkeretnek nevezünk. Egy 
időegység alatt a következőket hajtja végre a kódoló: 


e Beolvas egy új üzenetszegmenst. 


e Ebből és a tárolt m darab keretből kiszámít egy úgynevezett kódszó- 
keretet, amelyet megjelenít a kimenetén. Ha a kódszókeret n bites, 
az 

R — — 


n 
kifejezés a kódsebesség. 


e eldobja a legrégebben tárolt keretet, elraktározza az újonnan beolva- 
sottat, így az új ciklus elejére újra m üzenetszegmenst fog tárolni. 


Látató, hogy egy üzenetszegmens (m 7-1) lépéssel a megjelenése után tűnik 
el a kódolóból, így a K — (m - 1)k kifejezés a kódoló kényszerhossza 
bitekben. Az N — (m -- 1)n mennyiséget blokkhossznak nevezik, és azt 
mutatja meg, hogy egy bit a forráson hány bitet befolyásol a kimeneten. 

A kódoló berendezést léptetőregiszterekkel valósítják meg. (N,K) pa- 
raméterű konvolúciós kódnak, vagy trellis-kódnak nevezzük a lineáris, 
időinvariáns, véges kényszerhosszú kódokat, melyeknek a blokkhossza N 
és a kényszerhossza K. 


A kapott kódot egy úgynevezett fa-kód formájában lehet megadni. Ha 
a kódoló bementére ráeresztünk egy a nullával kezdődő, végtelen bit- 
sorozatot, akkor kapunk egy - szintén végtelen — kimeneti bitsorozatot. 
A fa-kód lényegében e sorozatok közötti hozzárendelést mutatja meg. 
Azért a , fa" elnevezés, mert az ilyen hozzárendelést sokszor bináris fa 
formájában adják meg, a fa gyökere az az állapot, amikor a léptetőregisz- 
terek minden tárolója nullával van feltöltve, és minden elágazás a fában 
egy-egy állapotból a lehetséges bemeneti bitkombinációk hatására létre- 
jövő változást jelképez. Mivel a bináris fa ábrázolás eléggé nehézkes, he- 
lyette alternatív reprezentálási módszereket — az állapotátmenet-gráfot 
és a trellis-diagramot — fogunk tanulni. 
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14.1. Példa: A kódoló áramkörünk blokkvázlata legyen a következő 





Adjuk meg a kódoló paramétereit és a bemeneti és kimeneti bitek közötti 
összefüggést. 
Mivel egyetlen bemeneti bit van, k — 1. A kimenetet a kódoló két bitből fésüli 
össze, tehát n — 2. Kettő darab tároló van a kódolóban, így m — 2, ebből pedig 
K —(m-7-1)-k—3é5N—(m-41):n-— 6. 

A kimenet páros, illetve páratlan bitjei a fenti kódoló esetén: 


C2i—-i  —  b;7-b;-i 


és 





Cai — bit bi-1- bi-2 


A bitjeink a GF(2) véges test elemei, tehát minden műveletet mod 2 kell nézni. 


14.2. Példa: Adjuk meg a következő blokkvázlattal rendelkező kódoló 
paramétereit, kódsebességét és a bemeneti és kimeneti bitek közötti össze- 
függést: 





A kódoló a bemenetet két bitfolyamra választja szét és abemenetet három bitsoro- 
zatból fésüli össze, így k — 2 az üzenetkeret, és n — 3 a kódszókeret hossza. A két 
ág közül a felsőben van több tároló, szám szerint 2, így m — 2. A kényszerhossz 
ebből K — 6 a blokkhossz pedig N — 9. A kódsebesség R — k/n — 2/3. 
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A hárommal osztva 1, 2, illetve 0 maradékot adó kimenetek a következőképpen 
függenek a páros és páratlan sorszámú bemeneti bitektől: 








c31-2  — — b2:-1 b2:-3 4 b21-5 - b2:, 
C3i-1  —  b2:-1 b2i-5 
és 
csi —  b2:-1tb2i—5 1 b2:. 





Egy k 5 1 üzenetkeret-hosszú konvolúciós kódolónak k darab bemenete 
van. Első lépésként a bemenő jelet úgy választja szét, hogy az i-edik 
bemenettre az i-edik, i -- k-adik, i -- 2k-adik,. . .bit kerüljön. Minden 
bemenethez tartozik egy a tárolósor. A k darab tárolósor kimeneteiből 
állítja elő a kódoló saját kimenetének megfelelő bitjeit, amelyeket úgy 
fésül össze, hogy először az első kimenet első bitjét adja le, majd a máso- 
dik kimenet első bitjét, a harmadik kimenet első bitjét, és így tovább. Az 
első kimenet második bitje az n-edik kimenet első bitje után következik, 
őt a második kimenet második bitje követi. . . 


Az egyes ágakat lehet egy-egy bitsorozattal jellemezni a következőkép- 
pen: A sorozat j-edik eleme akkor legyen 1, ha azon az ágon megjelenik 
az üzenet j-edik eltoltja, egyébként legyen a j-edik bit 0. Azért nevezik 
konvolúciós kódoknak az ilyeneket, mert a kimenet bitjeit a bemeneti 
bitsorozatnak a megfelelő ágat jelképező sorozattal vett moduló 2 konvolú- 
ciójaként kaphatjuk meg. A 14.1 példához tartozó két bitsorozat: a páratlan 
ághoz (1,1,0,0,0, . . .), apároshoz pedig (1,1,1,0,0, . . .). A 14.2 példa esetén 
a helyzet kissé bonyolultabb, ott ugyanis két bemenet van, így az egyes 
bemenetek hatását külön-külön kell figyelembe venni, s a végén összeadni 
őket. Az első bemenet hatása az első kimenetre az 1,1,1,0,0, . . . bitsorozattal 
jellemezhető, a második kimenetre az 1,0,1,0,0, . . . sorozattal, a harmadikra 
szintén az 1,0,1,0,0, . . . bitsorozattal. A második bemeneti ág hatása az első 
és a harmadik kimenetre az 1,0,0,0,0 . . . sorozattal írható le, míg a középső 
kimenetre tiszta nulla sorozattal. 


14.1. Állapotátmeneti gráf és trellis 


A kódolót lehet az állapotátmenet-gráfjával jellemezni. Az állapotátmenet- 
gráf minden csomópontja a kódoló tárolóiban szereplő különböző érté- 
keknek (mind a 14.1, mind pedig a 14.2 példa esetében 00, 01, 10 és 11) 
feleltethető meg, az élek az ezek közti átmeneteket jellemzik. Az éleken 
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fel szokták tüntetni a bementre kerülő bitkombinációt, és az adott éllel 
jellemzett átmenetkor a kimeneten megjelenő biteket. Minden állapotból 
2£ nyíl vezet egy-egy másik állapotba vagy önmagába, ez a 2"-féle bemenő 
jelnek megfelelő 2" lehetséges átmenetet jelképezi. 


14.3. Példa: Rajzoljuk fel a 14.1 példában látható kódoló állapotátmeneti 
gráfját. 

Tegyük fel, hogy a kódoló a 00 állapotban van, azaz mindkét tárolója 0-n áll, mint 
azt a következő ábrán a zöld számok mutatják 





Ha a bemenetre 0 kerül, akkor a következő lépésben ez az új 0-s lesz az első tárolón, 
az ott levő 0-s érték pedig átkerül a másodikra. Így a következő állapot megint a 
00 lesz. Ezt az átmenetet jelképezi az alábbi ábra bal szélén található nyíl. Mivel 
minden tárolt keret és a bemenet is 0 volt, a kimenet csak 00 lehet. Az átmenetet 
leíró nyílon feltüntetett számok közül az első a bemeneti bit, a ,,/"-jel utáni kettő 
pedig a kimeneti bitpáros. 

Ha a 00 állapotból kiindulva a bemenetre 1-es bit kerül, akkor a következő 
lépésben az az 1-es bit már az első tárolón lesz, az első tárolón levő 0 a második 
tárolóra lép, s mivel harmadik tároló nincsen a sorban, az második tároló nullását 
eldobjuk. 1 bemeneti bit hatására tehát a 00 állapotból az 10 állapotba kerülünk, 
ezt az átmenetet jelképezi az alsó ábra bal oldalán lévő, 00 felől 10-ba mutató 
nyíl. Ha a bemenet 1, akkor mindkét kódoló ágon 1 lesz a kimenet, mivel ahhoz 
az 1-hez a tárolókon levő nullák adódnak csak hozzá. Ezért van a nyílon , 1/117 
felirat. 
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A többi állapotátmenetet hasonlóan kell megvizsgálni, csak a kiindulási ál- 
lapot nem a 00 lesz, hanem az 10, a 01, illetve az 11. Az eredményt a fenti ábra 
tartalmazza. 


Az állapotátmeneti gráfból könnyen fel lehet rajzolni a kódoló úgyne- 
vezett trellis reprezentációját. A trellisen a lehetséges állapotok egymás 
fölött helyezkednek el, egy-egy ilyen állapot-oszlop jelképez egy-egy lé- 
pést a kódolásban. Annyi oszlopot rajzolunk egymás mellé, ahány lépést 
követni szándékozunk. Az alap trellis N lépést tüntet fel, ahol N továbbra 
is a blokkhossz. Az első csomópontja az az állapot, amikor csupa nullával 
vannak feltöltve a tárolók. Az első K lépés során felrajzolja, hogy különbö- 
ző bemeneti jelekre milyen állapotokba juthat a rendszer, majd a maradék 
lépésekben csupa nulla bemenetet tételezve fel kiüríti a tárolókat. Az egyes 
állapotok közötti átmeneteket jelképező nyilakra feltüntethető a bemeneti 
bit(sorozat) és a kimeneti bitsorozat, az állapotátmeneti gráfhoz hasonló 
alakban. A trellis-diagram megértését segíti a következő példa. 


14.4. Példa: Készítsük el a 14.3 példa állapotátmeneti gráfjából a szóban 
forgó kódoló alap trellisét 


Az alap trellis kiindulási állapota a 00-s tárolóállapot, amely az állapotátmeneti 
gráf bal szélén látható. A 00 állapotból 2 nyíl indul ki, az egyik szintén 00 állapotba 
visz, míg a másik az 10-ba. Az állapotátmenetekhez tartozó bemeneti és kimeneti 
bitek a gráfról leolvashatók. Ezeket az átmeneteket jelképezik az alábbi trellis bal 
oldali nyilai. A nyilakon ugyanaz a , bemeneti bit/kimeneti bitpáros" felirat van, 
mint az állapotátmeneti gráf 00 állapotából kiinduló két nyilán: 

















A trellis következő lépésében már két lehetséges kiindulási állapottal rendel- 
kezik, a 00-val és az 10-val. A 00-ból ugyanolyan állapotátmenetekkel ugyanolyan 
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állapotokba juthatunk, mint az előző lépésben. Az 10 állapotból az állapotátmeneti 
gráf szerint az 11, illetve a 01 állapotokba kerülhetünk, 00, illetve 11 kimenettel. 
Ezeket az átmeneteket a trellis második és harmadik oszlopa közötti nyílsorozat 
mutatja. 

A harmadik lépés során már mind a négy állapot lehet kiindulási állapot, így 
az állapotátmeneti gráfnak mind a nyolc nyilát el kell helyezni a harmadik és a 
negyedik állapotoszlop között. Innentől kezdve már csak nulla bemenetet tétele- 
zünk fel, és csak azokat az állapotátmenteket tüntetjük fel a gráfról, amelyeken 
0/XxXX" a felirat. 


Az14.4 példában felrajzolt alap trellis közepén a vékony zöld vonallal 
bekeretezett részt akárhányszor megismételhetjük, így nem csak a kényszer- 
hossznak megfelelő hosszúságú üzeneteket, hanem annál sokkal hosszab- 
bakat is nyomon lehet követni trellis diagramon. A trellisben az egymást 
folytonosan követő, a csupa nulla tartalmú tárolókkal induló, csupa nullá- 
ból álló állapotba visszatérő élsorozatokat utaknak nevezzük. Egy-egy út 
egy-egy kódszónak felel meg. Nézzünk egy példát. 


14.5. Példa: Vegyük a 14.4 példában feltüntetett alap-trellisszel rendelkező 
konvolúciós kódolót. Legyen a kódolni kívánt üzenet a 011101011. 


A következő ábrán kicsit egyszerűsített trellis diagramon fogjuk nyomon követni 
az üzenethez tartozó utat. Az egyes állapotokat csak egy-egy kör jelöli; azt, hogy 
melyik állapotról van szó, az ábra bal széléről lehet leolvasni. Az átmeneteket 
jellemző nyilakra csak a kimenet került rá, a lefelé mutató nyilak 0 bemeneti bitet, 
a felfelé mutatók 1-et jelentenek. (A trellis végét elhagytuk, nem tudható ugyanis, 
hogy három 0-s karakter jön-e valóban.) 


1 0O 





10 


01 





00 





Az első bit 0, mint az az ábra alján az első és második pontoszlop között láthatjuk. 
Az 0 bemenetnek a vízszintesen mutató, vastagon kihúzott zöld nyíl felel meg az 
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első és második állapotoszlop között. A kimenet látszik a nyíl feliratából: 00. A 
második, 1-es bemeneti bit újra a 00 állapotban találja a rendszert, és átviszi az 
10-ba, a kimeneten pedig két egyes jelenik meg. A harmadik, újfent 1-es bemeneti 
bit érkezésekor tehát az 10-s állapotban vannak a tárolóink, és az onnan kiinduló, 
felfelé mutató nyíl mentén átkerülnek az 11 állapotba. Ez alatt a lépés alatt a 
kimeneten 00 bitek generálódnak. Ezek alapján a többi lépés követhető: a vastag 
zöld vonal a bemeneti bitsorozatnak megfelelő útvonalat mutatja, a rajta látható 
felirat pedig a kimeneti biteket. A 011101011 bemenet hatására tehát a kimeneten 
a 0011 00 10 01 01 11 01 00 bitpár-sorozat fog megjelenni (vagy egyszerűen a 
001100100101110100 bitsorozat). 
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Ebből az ábrázolásmódból látszik, honnan van e diagramok elnevezése: 
a trellis angol szó, jelentése rácsozat (esetleg lugas). 


A rácsozat szabályos struktúrájú, egy-egy sora egy-egy állapotot je- 
lent, az i -- 1-edik oszlopa meg az 7-edik bit beolvasása után a lehetséges 
állapotokat: az i-edik mélységbeli csomópontokat. 


14.2. A konvolúciós kódok polinom-reprezentációja 


A konvolúciós kódolást is lehet polinomokkal reprezentálni, gondoljunk 
csak arra, hogy a 14.1 példánkban szereplő kódoló áramkör tulajdonképpen 
két polinomszorzó eredményét fésüli össze. A példánkban szereplő bináris 
polinomok: 


gui(t) — 1-4t 
9g12(t) s 13t34É. 


Azért van két indexe a g;j(t) polinomoknak, mert az első index jelöli az 
üzenetkeret i-edik bitjét, a második pedig a kódszókeret j-edik bitjét. Álta- 
lános esetben tehát k x n polinommal írható le egy (N, K, n, k) paraméterű 
konvolúciós kód üzenetkeretei és kódszókeretei közötti kapcsolat. Ezeket a 
polinomokat egy mátrixba rendezhetjük a 


gaa(t)  gi2(t) ...  gin(t) 
G() — gar g22() he ganl) (141) 
grki(t)  9ri(t) ... 9rn(t) 


szabály szerint. 
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14.6. Példa: Adjuk meg a 14.2 példában szereplő konvolúciós kódolót leíró 
polinom-mátrixot. 


A kódoló áramkör blokkvázlatából kitűnik, hogy az első (3-mal osztva 2 maradékot 
adó sorszámú) kimeneti biteket az első (páratlan sorszámú) bemeneti bitek, azok 
egy és két ütemmel eltoltjai hozzák létre. Ha ezt az ágat nézzük, az azt leíró 
polinom: 

gu(t$)—1-t-rB. 
Ugyanezt a kimenetet a második (páros sorszámú) bemeneti bitek hozzák létre, 
ezeknek semmiféle eltoltjai nem befolyásolják az első kimenetet, így 


9g21(t) I 1. 


A második kimeneti ágon az első bemeneti ág bitjei és azok két ütemmel késleltetett 
verziói jelennek meg, tehát: 

912(t) —1- t2. 
A második kimeneti biteket egyáltalán nem befolyásolják a második bemeneti 
bitek, így a g22(t) polinom 0 lesz. A harmadik kimenet ezek alapján egyértelmű, a 
G(t) polinom-mátrix pedig 


2 2 2 
13t3it 148 1-4t ) (142) 


sa ( 1 0 1 


Az üzenetkeretek sorozatát is lehet polinomokkal reprezentálni: az i- 
edik bemeneten megjelenő b; ,br.4.:,bok-ri, : : . sorozathoz hozzá lehet rendelni 
a 

50 (4) — b; bkyat 4 bopyat? Fk. . 


polinomot minden zi — 1.2, . . . ,k-ra. Az említett sorozatot úgy képezzük, 
hogy vesszük minden üzenetkeretből az z-edik bitet. E polinomokból 
tudunk egy sorvektort alkotni: 


b(i) — (00) Og) ... 49) ) (14.3) 


Ezzel teljesen analóg módon a kódszókeretekhez is rendelhető egy polinom- 
vektor, jelöljük azt c(t)-vel. Ekkor a kódolási szabály felírható a 


c(t) — b(t) : G(t) (14.4) 


alakban. 
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14.7. Példa: Kódoljuk az 1001110101 üzenetet a 14.2 példában szereplő 
kódoló áramkörrel. Használjuk fel a 14.6 példában felírt (14.2) polinom- 
mátrixot. 


Először készítsük el a kódoló két bemeneti ágának polinomjait. Az első bemeneti 
ágra az üzenet első, harmadik, ötödik, hetedik és kilencedik bitje kerül, azaz 10100. 
A második ágon van a többi bemeneti bit: 01111. Így 


bi($) — 1-40t£t-4182-406 4 0tt, 
bo(t) — 041t-19 4164 1t. 














A (14.3) polinom-vektor tehát: 
b(t) — (a FI) — (tr? -1- 19), 
amelyet a következőképpen szorzunk össze a (14.2) polinom-mátrixszal: 


2 2 3 4 
((12- 16) (1t-41t2-41t 4 1t9)) Í űj Í 


— (ci(t) c2(t) cs(i)), 


( 14-t-4-t 1468 148 ) 




















ahol 
ci(t) — (1418) -(1--1t-4- 182) 4 (1t4- 18 4 16? - 149) - (1) — 
— 1-41t416 618318 414 --1t 418 18116 —15418 
c2(t) — (1418)-(1-418)--(1t418 416 4 It) - (0) — 
— 13-18 F18£41tt340—1-16 
cs(t) — (1-4169)-(1416)-4(1t418 416? 719) - (1) — 
— 1418£-418-41t341t418 318 41tt—1-1t41£ 418 














A kimenetek első 5 üteme tehát: 


cs — 10100, 
c2 — 10001, 
cs — 11110, 


a kimenet ezekből összefésülve, c1 első bitje után c2 első bitje, majd cs3-é, ezután ci 
második bitje, ca második bitje, és így tovább: 111 001 101 001 010. Szóközöket az 
egyes ütemek határán csak a jobb átláthatóság kedvéért hagytunk. 
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14.3. Katasztrofális kódolók 


Nem minden lehetséges kódoló lesz jó, előfordulhat az, hogy egy idő után 
csupa nullából álló sorozat jön ki a kódolóból akkor is, ha nem csupa 0 
kerül a bemenetére, hanem egy ciklikusan ismétlődő, 1-eseket is tartalmazó 
bitsorozat. Az ilyen kódolókat katasztrofálisnak nevezik. 

Az, hogy a konvolúciós kód katasztrofális, látszik az állapotátmenet- 
gráfján: 





Ha ki tudunk jelölni a gráfban egy olyan zárt hurkot, amelynek az élein 
végig csupa nulla kimenet keletkezik, a bemenet mégsem csupa 0, akkor a 
kódoló katasztrofális. A fenti gráfon egy ilyen hurok van pirossal jelölve. 
Nem számít a keresett hurkok közé az ábrán kékkel húzott hurok: az, 
amelyik a 0-kkal feltöltött tárolókkal jellemzett állapotból 0 bemeneti bitek 
hatására önmagába mutat vissza. Ilyen hurok minden kódoló gráfján 
szerepel. 

Ha k — 1, azaz mindig csak egy bitből áll az üzenetkeret, akkor arra, 
hogy a kódoló ne legyen katasztrofális, létezik egy szükséges és elégséges 
feltétel: A k — 1 üzenetkeret-hosszú konvolúciós kódok közül nem ka- 
tasztrofális az, amelynek a 9g11(t),g12(t), : . . ,gin(t) generátorpolinomjainak 
a legnagyobb közös osztója az 1. 


14.4. Távolságprofil, szabad távolság 


Mivel a blokk-kódoknál a kódszavak közötti minimális távolság (kódtávol- 
ság) fontos volt a javítható hibák számának megbecsüléséhez, a konvolúciós 
kódoknál is szeretnénk egy hozzá hasonló mennyiséget bevezetni. Itt nem 
beszélhetünk kódszavakról, mivel a kódszókeretek nem függetlenek egy- 
mástól, s nem lehet egyértelműen azt mondani, hogy az üzenetnek egy 
adott szakasza hozza létre a kód egy meghatározott szakaszát. 

Tegyük fel, hogy a kódszókeretek hossza n. Legyen df a lehetséges kime- 
neti jelsorozatok első i darab kódszókeretéből képezett vektorok Hamming- 
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távolságai közül a minimális. A dj,dő, . . . mennyiségeket a konvolúciós 
kódunk távolságprofiljának nevezik. Ahogy növeljük a figyelembe vett 
kódszókeretek számát - így a vizsgált vektorok hosszát —, a köztük lévő 
Hamming-távolság nem csökkenhet: 


d Séd Ég 


Mivel a konvolúciós kódolás lineáris folyamat, az egyes d; távolságok 
kiszámításakor nem kell minden lehetséges, i hosszúságú kimeneti bitsoro- 
zatnak minden másik ; hosszúságú kimeneti bitsorozattól vett Hamming- 
távolságát vizsgálni, elég csak a tiszta 0-ból álló kimenettől vett távolságo- 
kat nézni. 

A d7-okból álló monoton növekvő sorozat határértékét hívják a konvo- 
lúciós kód szabad távolságának, d..-nel jelölik, és a 


ok 
doo — max d; 


formulával definiálják. 

A csatornakódolás során az a cél, hogy minél nagyobb legyen a kód- 
szavak közötti távolság. A kódolási nyereségen a kódolatlan és a kódolt 
jelsorozat szabad távolságainak arányát értjük, decibel skálában: 


d 
— 201g —- 
Gg 87 





(14.5) 
ref 

A kódolatlan sorozat a referencia, innen a nevező indexe. (A § az angol 
gain-nyereség szóból származik.) 


14.4.1. Ungerboeck-kódok: komplex kódábécé használata 


Az Ungerboeck-kódok a (0,1) bináris számok helyett 27 darab komplex 
számot használnak jelkészletként. Látványos ha az ábécé elemei a komplex 
egységvektor i : 3607 /2" szöggel való elforgatottjai, i — 0,1, . . . 27 — 1-re. Az 
ilyen kódábécé elemeit fázismodulációval (2"PSK) könnyen a csatornára 
tudjuk bocsátani: minden elemnek : - 3607 /2" szögű fázistolás felel meg. 
Példaként álljon itt a 4PSK és a 8PSK jelkészlete (a piros karikák a komplex 
számok): 
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A kódoló a k bitből álló üzenetkereteket képezi komplex számokból álló 
sorozatokba. A c1, c2 (esetleg végtelen) kódszavak távolsága a hozzájuk 
rendelt komplex vektorok hagyományos, euklideszi távolsága: 


1/2 
d(c1,c2) s b lc1i Sz al?) 


Például a 4PSK ábécé elemeinek távolsága 42, a BPSK-é növekvő sorrend- 


ben 4/2 — V2, V2, V2 7 v2 és 2. 


4PSK jelkészletet lehet például két kimenetű konvolúciós kódolókkal 
előállítani, ha a 00 — 07, 01 — 907, 10 — 180" és 11 — 2707 hozzárendelé- 
seket alkalmazzuk a kódoló kimenete és a fázistolások között. Hasonlókép- 
pen 8PSK-t három kimenetelű kódolóval lehet megfeleltetni. 

Ha kilépünk a számegyenesről a komplex számsíkra, akkor amellett, 
hogy a kapott jelsorozat mindenféle köztes transzformációk nélkül alkal- 
mas modulációra, a kódolási nyereséget is tudjuk növelni. 


Tartalom ] Tárgymutató az 3 a185 b 


Információelmélet A Viterbi-dekódolás 
Tartalom ] Tárgymutató S SG 41365 





15. A Viterbi-dekódolás 


A konvolúciós kódok azért is előnyösek, mert van egy jól algoritmizálható, 
látványos dekódoló algoritmusuk, amely nem köti meg a lehetséges hibák 
számát, nem tartalmaz számításigényes mátrix-invertálásokat, de még line- 
áris egyenletrendszereket sem kell megoldani az üzenet reprodukálásához. 
Egyetlen dolog kell csak, hogy a dekódoló ismerje a trellist, amely a kódot 
létrehozta. 


Tegyük fel, hogy a csatorna bemenetére a c — (c1,c2, . . . c) (bináris) 
vektort adtuk, a v — (v1,v2, . . . vw)-t pedig a kimeneten vettük. A vevő 


ismeri a kódoló trellisét, de nyilván nem tudja azt, hogy a trellis melyik 
útján jött létre c. 

A Viterbi-algoritmus a trellis minden éléhez egy súlyozó faktort rendel, 
mintha minden él más és más hosszúságú lenne. A különböző élekhez 
rendelt hosszakat nevezik mértéknek, vagy metrikának. Így a lehetséges 
utaknak is tudunk hosszát definiálni, ha összeadjuk az éleinek a metrikáját. 


Az élek metrikáját úgy választják meg, hogy arányos legyen a 


2 log p(wilci) 


ieD 


kifejezéssel, ahol az összegzés az adott él által létrehozott kódszókeretben 
található c; bitekre hajtandó végre. Az összegzés az aktuális kódszókeret 
minden indexére vonatkozik, ezt az indexhalmazt jelöljük D-vel. A formu- 
lában szereplő feltételes valószínűség azt takarja, hogy mekkora a v; bit 
vételének a valószínűsége, ha a c;-t adtuk a csatornára. A Viterbi-algoritmus 
a lehetséges utak közül keresi a maximális valószínűségűt. A kódszavak 
ilyen dekódolása ekvivalens azzal, hogy ha a lehetséges kódszavak közül 
maximum likelihood döntéssel választunk a vett jelek alapján. 

Bináris szimmetrikus csatorna esetén belátható, hogy a maximális metri- 
kájú út helyett lehet azt keresni, amelyik a vett vektortól minimális Hamming- 
távolságra van. 


Az egész gondolatmenet feltételezi azt, hogy a csatornánk szinkron 
és az egyes szimbólumoknak a csatornán való áthaladása egymástól 
független esemény. Ekkor lehet ugyanis a DP(vz; V;; . . . Vi, ICis Ci - : - Ci) 
valószínűséget p(v;, Icz, ) valószínűségek szorzataként felírni, így az össz- 
valószínűség logaritmusa a részvalószínűségek logaritmusainak össze- 
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A Viterbi-algoritmus a következő ciklust hajtja végre: 


Veszi az 1-edik kódszókeretet. 


e Ennek ismeretében a trellis i — 1-edik és i-edik oszlopa közötti ágaknak 
kiszámolja a súlyát. 


előhívja a memóriából az i — 1-edik mélységbeli csomópontokhoz 
tartozó összesített súlyt. Egy-egy ilyen állapot összesített súlyához 
hozzáadja a belőle kiinduló ágak súlyait. A kapott értékeket azokhoz 
az i-edik mélységbeli állapotokhoz rendeli hozzá, amelyekbe mutat- 
nak. Ekkor minden i-edik mélységbeli állapothoz annyi új összesített 
súly tartozik, ahány él fut belé. (A refpelda:konvTR példánkban, és 
minden 1 üzenetkeret-hosszú, bináris kódolónál két érték fog egy 
csomópontra jutni.) 


Az állapotokhoz rendelt súlyok közül kiválasztja a maximálisat, ez lesz 
a csomópont új összesített súlya. A súlyt és a hozzá vezető útvonalat 
(az elejétől kezdve) eltárolja. Ezek az útvonalak a túlélők. A nem 
használt össz-súlyokat a dekódoló eldobja. Azokat a trellis i — 1-edik 
és i-edik mélységi szintje közötti éleket, amelyek nem tartoznak a 
túlélő útvonalba, törli az ábrából. 


15.1. Példa: Tegyük fel, hogy a 14.4 példában vizsgált kódolónk 011101011 
bemenetére adott választ adjuk a csatornára, és ott két helyen, a harmadik 
és az ötödik pozícióban hiba történik. Ekkor a 


001100100101110100 


bitsorozat helyett a 
0001101001011101 00 
lesz a csatorna kimenetén. 


Az alábbi ábrán - emlékeztetőül — kódoló trellise és a kódszó útvonala található. 


10 10 10 10 10 10 10 


ÜZE 
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A dekódolás menete a következő. A metrika itt a vett bitpár és az adott 
élhez tartozó bitpár közötti Hamming-távolság, így nem a maximumot, hanem 
a minimumot kell keresni. Nézzük a lépéseket. A kiindulási állapot a 00 állapot, 
az ő össz-súlya 0, ez látszik a következő ábrán az első mélységi csomópont felett 
vastagon (és zölden) szedve. 

Az első bemeneti bitpáros a 00, amely a trellis első és második pontoszlopa 
között alul fel is van tüntetve. A vett bitpáros az alsó állapotátmenetet jellemző 
él 00 kimenetétől nem tér el, így a kettő Hamming-távolsága 0, ezt hozzáadva a 
kiindulási 0 össz-súlyhoz 0-t kapunk, ez lesz a 00 állapothoz tartozó második mély- 
ségi csomópont összsúlya. Az első bemenetnek a másik lehetséges állapotátmenet 
kimenetétől — az 11-től -— való Hamming-távolsága 2, így a második mélységbeli 
01 állapot össz-súlya 2, ami az állapot felett vastag szedéssel fel is van írva. Mivel 
az első lépésekben még csak egy-egy él fut be az egyes állapotokba, a túlélő él 
egyértelmű. 

A második és harmadik állapotoszlop között már négyféle átmenet lehetséges, 
ezek mindegyikének ki kell számolni a 01 bemenettől vett Hamming-távolságát, 
és hozzáadni a kiindulási állapot össz-súlyához, hogy megkapjuk a végállapotok 
össz-metrikáját. Az eredmények a harmadik mélységi csomópontok felett vastag 
szedéssel láthatók. 











00 01 10 10 01 01 11 01 00 


A következő, 10 vett bitpáros újabb problémát vet fel. A harmadik és negyedik 
mélységbeli csomópontok között ugyanis 8-féle állapotátmenet lehetséges, így 
minden állapotba 2 él fut be, ezek közül el kell dönteni, melyik a túlélő. Nézzük 
azokat az átmeneteket, amelyek a legalsó, 00-s állapotba érkeznek: 


e Az első ilyen átmenet kiindulási állapota az előző oszlopbeli 00 állapot, mely- 
nek addigi össz-súlya 1 volt. Az átmenethez tartozó 00 kódoló-kimenetnek az 
10 bemenettől vett Hamming-távolsága 1, így ezen az útvonalon az össz-súly 
173-1—- 2lesz. 


A másik lehetséges, 00-ba torkolló állapotátmenet kiindulási pontja a 01 
állapot, melynek össz-súlya az előző lépésben 3 volt. Ehhez kell hozzáadni az 
él 10 kimenetének az 10 bemenettől vett Hamming-távolságát, azaz 0-t. Így 
ezen az útvonalon a 00 állapot össz-metrikája 3 -- 0 — 3 lenne. 
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A két össz-súly közül nyilván az első a kisebb, így a túlélő él a 00 — 00 él lesz, a 
másikat törölni kell: pirossal áthúztuk. 

A többi állapotra ezek a lépések egyszerűen általánosíthatók, az eredmények 
az ábráról leolvashatók. A diagramon nem tüntettük fel az élekhez tartozó mér- 
téket, csak áthúztuk pirossal a nem túlélőket. A csomópontok fölött vastagon 
szedve a hozzájuk vezető túlélő útvonal összesített metrikája látható. Ha mindkét 
befutó él azonos értéket hozott, akkor véletlenszerűen döntöttünk. Az ábra alján 
látszanak az adott lépésben bejövő bitpárok. 

Az utolsó lépés után az 11 állapotnak van a legkisebb össz-súlya — méghozzá 2 — 
az lesz a végső túlélő él végpontja. Ebből a pontból kiindulva visszafelé meg tudjuk 
találni a túlélő útvonalat, hiszen minden csomópontba csak egyetlen túlélő él fut be. 
Ez a végső túlélő útvonal, ennek a csomópontjai vannak zöld pöttyökkel kiemelve. 
Figyeljük meg, hogy az ideális útvonal mentén csak azokban a lépésekben nőtt a — 
zöld színnel kiemelt — metrika, ahol a csatornán hiba keletkezett, vagyis a második 
és a harmadik lépésben. Az össz-súly, 2 is a keletkezett hibák számát adja meg. 

Ha követjük a minimális metrikájú végállapothoz vezető utat, megkapjuk a 
csatorna bemenetére adott bitsorozatot 011101011-et. Ehhez persze tudni kell a 
kódoló trellisének éleit létrehozó bemeneti biteket. 


A Viterbi-dekódolásnál is előfordulhat, hogy rossz üzenetté dekódoljuk 
a vett jeleket, különösen akkor, ha a csatorna többet hibázik. Gondoljunk 
csak bele, hogy ha a 15.1 példában dekódolt 00 01 10 10 01 01 11 01 00 
bitsorozat nem a 00 11 00 10 01 01 11 01 00 bitpáros -sorozatból keletkezett 
két hibával, hanem az 11 00 10 10 01 01 11 01 00 kódból jött létre a csatorna 
3 hibája után, akkor is ugyanazzá a 011101011 üzenetté dekódolnánk, holott 
az 111101011-ből keletkezett. 

Az, hogy a Viterbi-algoritmussal milyen bithiba-arányú átvitel mellett 
tudunk hiba nélkül dekódolni, attól függ, hogy mekkora az alkalmazott 
konvolúciós kódolás szabad távolsága. 
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